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本 书 作为 学 习 UNIX V6 内 核 源码 的 参考 读物 ， 值 得 向 读者 推荐 。 


国内 计算 机 方面 的 翻译 书籍 以 欧美 作者 的 著作 为 主 ， 这 与 相关 的 技术 
多 起 源 于 欧美 有 很 大 关系 。 在 实际 的 学 习 和 工作 中 ， 我 也 接触 了 许多 
日 文书 籍 ， 我 认为 此 领域 的 日 文书 籍 也 很 有 特色 。 因 为 日 文书 籍 很 擅 
长 从 读者 的 角度 出 发 ， 配 合 大 量 的 实例 与 图 表 ， 深 入 浅 出 地 将 一 个 复 
杂 有 的 问题 讲解 清 苞 ， 非 肖 适 合 初学 者 或 者 工程 技术 人 员 阅 读 。 

正如 作者 在 前 言 中 写 到 的 ， 这 本 书 是 基于 作者 在 学 习 UNIX V6 内 核 产 


码 过 程 中 的 笔记 和 博客 而 写成 的 ， 因 此 对 初次 接触 UNIX V6 内 核 的 读 
者 而 言 ， 无 疑 生 一 本 很 好 的 参考 读物 。 


但 是 也 应 该 注意 到 ， 正 是 因为 这 一 点 ， 一 些 作 者 已 掌握 的 知识 点 ， 书 
中 并 未 详细 阐述 。 因 此 ， 将 本 书 定位 于 参考 书 ， 同 时 配合 附 如 中 的 其 


他 参考 资料 ， 再 借助 模拟 器 simh 实际 动手 操作 ， 这 样 三 管 齐 下 才能 真 
正 达 到 理解 UNIX V6 内 核 源码 的 目的 。 


我 一 直 很 想 将 优秀 的 计算 机 日 文书 籍 介绍 给 国内 的 广大 读者 。 因 为 工 
作 每 低 ， 迟 迟 没有 付 请 实际 行动 ， 直 到 今年 才 在 图 灵 公 司 的 大 力 文 持 
实现。 在 这 里 特别 向 本 书 的 编辑 表示 训 心 的 感谢 ,他们 从 译文 的 逻 
辑 表 达 和 语法 等 方面 提出 了 宝贵 的 意见 。 


同时 ， 也 要 疝 原 著作 者 青 柳 隆 宏 先生 致敬 。 他 的 语言 表达 非常 亚 遵 ， 
条 理 十 分 鲜明 。 这 使 得 原著 在 日 本 亚马逊 网 站 中 获得 了 4 星 的 高 分 。 
最 后 ， 我 要 问 家 人 表示 谢意 。 这 本 书 基本 都 是 利用 平时 下 班 后 和 周末 
的 时 间 来 完成 的 ， 没 有 父母 、 妻 子 及 两 个 可 爱 的 孩子 的 文 择 ， 我 很 难 
顺利 、 按 时 完成 翻译 工作 。 


本 书 的 翻译 肯定 会 有 许多 不 足 ， 欢 迎 广大 读者 提出 宝贵 意见 或 来 信 交 
流 。 我 的 邮箱 地 址 是 unixv6.yinzx@gmail.com， 我 会 尽 可 能 给 与 答复 。 


如 果 本 书 能 给 大 家 提供 一 些 帮 助 的 话 ， 我 会 感到 十 分 欣慰 。 


筷 中 羯 
2013 年 10 月 于 福冈 


前 言 


本 书 针 对 1975 年 由 贝尔 实验 室 1 发 布 的 UNIX 第 6 版 (Sixth Edition 
Unix， 此 后 简称 为 UNIX V6 ) 的 内 核 源 代码 进行 解说 。 面 向 的 读者 主 
I ， 以 及 从 事 计算 机 相关 行业 的 具有 初中 级 水 平 

» Da O 


1 美国 的 AT&T 公司 和 Western Electric 公司 于 1925 年 设立 的 研究 开发 机 构 。 


PN 


考虑 到 一 部 分 读者 会 有 诸如 “我 对 内 核 源 代 码 根本 不 感 兴趣 ?或 者 “与 这 
种 老 古 董 相 比 ， 我 喜欢 更 现代 的 操作 系统 ”等 看 法 ， 笔 者 想 先 阐述 一 下 


阅读 内 核 源 代 码 的 引人入胜 之 处 ,然后 再 解释 UNIX V6 为 何 适合 初次 接 
触 内 核 源 代码 的 读者 。 


阅读 内 核 源 代码 的 意义 


我 们 可 以 将 操作 系统 (OS，Operating System) 看 做 是 一 种 软件 ( 集 

合 ) ， 它 对 包括 硬件 和 软件 在 内 的 计算 机 系统 的 各 个 部 分 进行 管理 ， 

并 为 用 户 提 供 便于 使 用 的 操作 界面 。 内 核 作 为 操作 系统 的 核心 部 分 , 提 

供 计 算 机 系统 必 备 的 功能 ， 因 此 也 被 称 为 狭义 的 操作 系统 。 例 如 ， 

shell 之 类 的 程序 通常 不 是 内 核 的 一 部 分 ， 而 是 利用 内 核 提供 的 功能 3 

ee 内 核 以 外 的 程序 通常 被 称 为 用 户 空间 (userland) 程序 ， 或 用 
予 O 


通过 阅读 并 理解 内 核 源 代码 ， 我 们 会 有 如 下 收获 。 

对 计算 机 系统 的 全 貌 有 更 深入 的 了 解 

掌握 了 作为 计算 机 系统 核心 部 分 的 内 核 ， 不 仅 对 操作 系统 ， 对 计算 机 
的 全 貌 也 会 有 更 为 深入 的 认识 。 对 通过 大 学 课程 或 其 他 途径 学 习 的 各 
种 领域 、 各 个 层面 的 知识 之 间 的 关联 性 也 会 有 更 清晰 的 认识 ,让 人 有 了 醒 
酮 灌顶 的 感觉 

让 操作 计算 机 成 为 一 种 令 人 愉快 的 体验 

理解 了 计算 机 系统 的 全 貌 ， 操 作 计 算 机 本 喘 也 会 变 得 更 加 令 人 愉快 。 
比如 ， 在 计算 机 上 执行 某 个 程序 的 时 候 ， 如 果 能 够 准确 把 握 系统 内 部 
所 进行 的 操作 ， 是 不 是 一 件 很 令 人 兴奋 的 事情 呢 ? 这 种 体验 将 加 深 读 
者 对 计算 机 的 兴趣 ,使 读者 更 有 动力 去 提高 自己 的 技术 水 平 。 

加 深 对 知识 的 理解 

阅读 代码 与 否 ， 对 知识 的 理解 程度 会 有 云 泥 之 差 。 如 果 只 学 习 了 概 

要 ， 既 容易 遗忘 也 难以 应 用 。 相 反 ， 理 解 代码 能 够 使 你 对 学 到 的 算法 
和 思路 举一反三 ,使 之 成 为 可 以 受用 一 生 的 财富 。 

提升 技术 人 员 自 身 的 水 平 


作为 计算 机 行业 的 反 术 人 员 ， 阅 读 并 理解 了 内 核 源 代码 有 助 于 在 专业 
领域 里 将 目 己 提 升 到 一 个 者 的 层次 。 尽 管 在 全 球 范围 内 这 个 领域 的 从 


业者 不 断 增加 ， 但 是 在 了 解 应 用 层面 的 同时 ， 对 操作 系统 等 底层 的 知 
识 也 有 所 了 解 ,并 且 能 够 对 系统 做 出 整体 优化 的 技术 人 员 , 仍 是 凤毛麟角 


但 是 恰恰 是 具备 这 种 素质 的 人 ， 才 能 在 第 一 线 发 挥 不 可 殖 代 的 作用 。 
如 果 想 拉 大 与 竞争 对 手 的 差距 ,是 必须 理解 系统 内 核 的 。 


为 何 选择 UNIX V6 


接 下 来 想 说 明 一 下 为 什么 不 选择 最 新 的 操作 系统 ， 而 将 历史 比较 悠久 
的 UNIX V6 作为 本 书 的 题材 。 


代码 行 数 约 为 1 万 行 


UNIX V6 的 内 核 源 代码 包括 设备 驱动 程序 在 内 约 有 1 万 行 ， 这 个 数量 
的 源 代 码 ， 初 学 者 是 能 够 充分 理解 的 。 有 一 种 说 法 是 一 个 人 所 能 理解 

的 代码 量 上 限 为 1 万 行 ，UNIX V6 的 内 核 源 代码 从 数量 上 看 正好 在 这 
个 范围 之 内 。 看 到 这 里 ， 大 家 是 不 是 也 有 “如 条 只 有 1 万 行 的 话 没准 儿 
我 也 能 学 会 ”的 想法 呢 ? 

另 一 方面 ， 最 近 的 操作 系统 ， 例 如 Linux 最 新 版 的 内 核 源 代码 据说 超 


过 了 1000 万 行 *。 就 算 不 是 初学 者 ， 想 完全 理解 全 部 代码 基本 上 也 是 
不 可 能 的 。 


2 http://www.h-online.com/open/features/Kernel-Log-15-000-000-lines-of-code-3-0-promoted-to- 
long-term-kernel-1408062.html 。 


充实 的 资料 


UNIX V6 的 用 户 手册 、 相 关 资 料 和 论文 都 可 以 在 网 上 找到 “。 运行 
UNIX V6 所 需 的 处 理 装置 PDP-11 以 及 周边 设备 的 设计 文档 ， 很 大 一 部 
分 也 可 以 检索 到 。 


另外 ， 有 一 本 关于 UNIX V6 的 指南 已 经 问世 多 年 。 此 书 名 为 《 莱 昂 氏 
UNIX 源 代码 分 析 》 (Lions' Commentary on UNIX ， 机 械 工 业 出 版 社 出 
版 ) ， 由 澳大利亚 新 南 威 尔 士 大 学 的 约 除 :有 菜 昂 (John Lions) 教授 撰 
写 ， 也 被 称 为 Lions 书 (Lions Book) [13 。 这 本 书 由 于 UNIX 的 版 权 
问题 ， 据 说 当时 只 能 在 学 生 之 间 私 下 传 看 ， 后 来 才 广 泛 地 流传 开 来 ， 


现在 可 以 从 网 上 免费 下 载 由 。Lions 书 对 本 书 中 基本 没有 涉及 的 PDP- 
We 
By o 


3 本 


二 


以 [数字 ] 形式 标注 的 部 分 在 书 尾 附录 中 有 相对 应 的 内 容 。 


“同时 审 校 者 推荐 《UNIX 操作 系统 教程 》， 西 安 电 子 科技 大 学 出 版 社 于 1985 年 6 月 出 版 ， 
尤 普 元 主编 。 这 是 一 本 详细 剖析 UNIX V6 机 制 和 源码 的 教材 。 校 者 注 


网 罗 了 操作 系统 的 基本 功能 


UNIX V6 虽然 比较 老 ， 但 是 它 实现 了 构成 操作 系统 的 大 部 分 基本 功能 
。 目前 最 新 的 操作 系统 大 部 分 都 是 以 它 为 基础 发 展 而 来 的 ， 因 此 以 
UNIX V6 为 入 门 教材 对 我 们 了 解 最 新 的 操作 系统 来 说 会 很 有 帮助 。 


线程 、 网 络 、GUI、 多 核 文 持 、 庶 拟 机 等 这 些 UNIX V6 不 具备 的 功能 
在 近 些 年 的 操作 系统 中 得 以 实现 。 这 些 功能 当中 有 很 多 其 实 是 以 UNIX 
V6 实现 的 功能 为 基础 的 。 


简化 的 设计 
UNIX V6 作为 一 种 后 期 的 操作 系统 ， 功 能 实现 比较 商 单 。 而 最 新 的 操 


作 系统 要 顾及 更 多 的 问题 ， 同 时 也 要 考虑 到 性 能 的 优化 ， 因 此 实现 也 
更 为 复杂 。 如 果 是 首次 阅读 内 核 源 代 码 ,用 相对 简单 的 UNIX V6 更 合适 


便于 读者 对 系统 有 完整 的 了 解 


前 面 已 经 说 过 ， 从 代码 量 上 看 ， 通 读 UNIX V6 内 核 源 代码 对 个 人 来 说 
是 可 以 做 到 的 。 如 果 更 进一步 ， 对 系统 内 置 的 用 户 程序 集 (如 shell) 

的 代码 或 是 周边 设备 的 设计 文档 也 有 所 涉猎 的 话 ， 就 会 对 包括 内 核 在 
内 的 计算 机 系统 整体 有 更 深入 细致 的 了 解 。 上 述 系 统 内 置 的 用 户 程序 
集 的 代码 或 设计 文档 与 最 新 产品 相 比 ， 在 实现 上 更 为 简单 ， 也 更 容易 


理解 。 
有 模拟 器 可 供 参考 


simhl7] 这 款 模拟 器 能 够 模拟 包括 PDP-11 系列 的 许多 处 理 器 ， 可 以 用 来 
运行 UNIX V6。 因 此 在 阅读 源 代码 时 可 以 随时 通过 模拟 器 确认 不 太 明 


白 的 地 方 。 在 simh 上 运行 UNIX V6 的 方法 请 参考 附录 A.1 的 [8]、 
[21] 和 [22] 。 


几 个 难点 


当然 ，UNIX V6 也 存在 它 特 有 的 问题 。UNIX V6 的 大 部 分 代码 使 用 了 
C 语言 编写 ， 而 当时 的 C 语言 还 处 于 初期 阶段 ， 在 语法 规格 上 与 现在 
的 C 语言 有 所 不 同 (顺便 提 一 下 ，C 语言 束 是 因为 编写 UNIX 才 诞 生 
的 ) 。 当 时 的 C 语言 使 用 K&R5 之 前 的 语法 ， 因 此 也 被 称 为 pre 
K&R。 请 看 下 面 的 例子 (代码 清单 1) 。 

5 这 里 指 的 是 C Programming Language 这 部 讲述 C 语言 的 名 著 (Brian W. Kernighan 、Dennis 
M. Ritchie 合 著 ) 。 根 据 两 位 作者 姓氏 的 首 字母 ， 此 书 也 被 称 为 K&R ， 中 文 版 书 名 是 《C 程 
序 设 计 语 言 》， 由 机 械 工业 出 版 社 出 版 。 一 一 译 者 注 


代码 清单 1 当时 的 C 语言 的 示例 


struct { 
char high; 
char low; 


~ 


hogehoge(arg) { 
int hoge; 
hoge = arg; 
return hoge->low; 


. 
2 
3 
4 
5 
6 
7 
8 
9 
1 


© 
Cp] 


估计 会 有 读者 提出 “为 什么 画 数 hogehoge( ) 没有 定义 返回 值 和 参 
数 ”"、“ 为 什么 对 int 型 的 hoge 6 可 以 使 用 hoge-> 这 样 的 写法 ”等 疑 
问 。 这 是 由 C 语言 当时 的 语法 决定 的 。 


6 hoge 以 及 后 文中 出 现 的 fuga 等 是 日 语 中 经 常 使 用 的 伪 变 量 名 ， 类 似 于 英语 中 的 foo 、 
bar 。 一 一 译 者 注 


虽然 存在 这 种 语法 上 的 差异 ， 但 pre K&R C 的 语法 规格 说 明 书 [16] 可 以 
在 网 上 获取 ， 而 且 如 果 是 了 解 当 代 C 语言 的 读者 ， 应 该 不 会 很 难 理 
解 。 而 比较 特殊 的 pre K&R C 语法 ， 请 参考 本 书 的 附录 。 


另外 ， 和 其 他 很 多 程序 一 样 ，UNIX V6 的 一 部 分 代码 采用 了 汇编 语言 
来 编写 。 这 对 首次 接触 汇编 语言 的 读者 来 说 可 能 会 有 影响 。 但 坪 ， 
UNIX V6 使 用 的 PDP-11 (参考 第 1 章 ) 的 汇编 语言 的 规格 说 明 书 [171 
也 可 以 在 网 上 找到 ， 慢 慢 熟 悉 就 会 适应 了 。 


面向 的 读者 


本 书 主要 面向 计算 机 专业 的 学 生 ， 以 及 从 事 计算 机 相关 行业 的 具有 和 初 
中 级 水 平 的 技术 人 员 。 特 别 适合 那些 通过 大 学 课程 和 其 他 入 门 书 对 操 
作 系统 有 所 了 解 ,但 是 对 具体 细节 缺乏 深入 理解 的 读者 ， 或 是 那些 对 操 
作 系 统 的 具体 实现 有 兴趣 的 读者 。 


需要 具备 的 知识 基础 


UNIX V6 内 核 的 大 部 分 代码 都 是 用 C 语言 写成 的 ， 因 此 读者 必须 具备 
C 语言 的 知识 基础 ， 也 要 掌握 栈 、 队 列 等 基本 数据 结构 和 算法 的 知识 
。 另外， 如 果 能 了 解 计算 机 的 运行 原理 ， 比 如 程序 在 执行 时 需要 首先 

0 然后 从 程序 计数 器 指定 的 内 存 地 址 读 取 指令 等 ， 束 更 为 

理想 。 


对 那些 完全 不 了 解 操 作 系统 的 朋友 来 说 ， 本 书 的 难度 可 能 有 点 大 。 建 
议 先 参考 在 本 书 附录 部 分 介绍 的 入 门 书籍 (附录 A.1 中 的 [5] 和 

[6]) ， 等 掌握 了 操作 系统 的 基本 知识 后 再 来 阅读 本 书 ， 这 样 可 能 会 达 
到 事半功倍 的 效果 。 

本 书 的 结构 

第 1 章 介 绍 UNIX V6 的 整体 概要 。 

第 2 章 到 第 4 章 介 绍 用 来 管理 程序 运行 的 进程 (process) 。 第 2 章 概 
述 进 程 。 第 3 章 说 明 进 程 的 控制 方法 。 第 4 章 说 明 以 有 效 利 用 有 限 内 
存 空间 为 目的 的 交换 (swap) 处 理 。 

第 5 章 和 第 6 章 介 绍 因 某 种 事项 中 断 当 前 进程 运行 ， 并 转 而 处 理 该 事 
项 的 几 种 机 制 。 第 5 章 首先 介绍 如 何 处 理 周 边 设 备 和 CPU 内 部 发 生 的 


中 断 请 求 。 然 后 介绍 了 系统 调用 (system call) ， 系 统 调用 是 利用 中 断 
请 求 来 连接 用 户 程序 和 内 核 的 机 制 。 第 6 章 主要 介绍 信号 (signal) ， 


人 
7 章 章 介 绍 磁盘 等 设备 的 IJO 处 理 。 第 7 章 说 明 块 (block) 
备 子 系统 ， 第 8 昔 说 明 块 设备 驱动 程序 。 

9 章 和 第 10 草 对 文件 系统 进行 说 明 。 文 件 系统 隐藏 了 块 设备 的 存储 
节 ， 辐 用 户 提 供 访问 数据 的 统一 方法 。 第 9 章 介绍 文件 系统 的 概 
， 第 10 章 对 文件 的 操作 加 以 说 明 。 

介绍 用 来 实现 进程 间 数 据 通信 的 管道 (pipe) 。 

介绍 行 式 打印 机 的 IO 处 理 。 

13 章 介 绍 终端 处 理 。 终 端 处 理 使 用 户 能 够 以 会 话 的 方式 操作 系统 。 
14 章 说 明 系 统 的 启动 处 理 。 

内 核 的 整体 结构 和 各 章 之 间 的 对 应 关系 如 图 1 所 示 。 


沪 潍 


站 避让 对 烛 革 划 


Xt 


用 户 程序 


be 
™ 


5 
' 系统 调用 


图 1 内 核 整 体 结 


上 述 章节 是 根据 笔者 认为 在 阅读 UNIX V6 内 核 源 代码 时 应 该 遵循 的 顺 
序 而 编排 的 ， 将 读者 可 能 更 感 兴趣 的 有 关 进 程 和 文件 系统 的 内 容 尽 量 


安排 在 前 半 部 分 ， 其 他 的 内 容 则 安排 在 后 半 部 分 。 另 外 ， 在 阅读 各 章 
时 所 需 的 知识 ， 尽 量 在 前 面 的 章节 中 加 以 说 明 。 

关于 本 书 的 说 明 

因为 篇 幅 有 限 ， 所 以 本 书 以 介绍 内 核 的 基本 处 理 过 程 为 主要 目的 ， 对 
比较 少见 的 处 理 和 异常 处 理 没有 进行 特别 细致 的 说 明 。 此 外 ， 本 书 从 
所 有 代码 中 挑选 出 比较 重要 的 部 分 ( 占 所 有 代码 的 70%~80%) ， 省 略 
不 是 很 重要 的 部 分 或 非常 简单 无 需 说 明 的 代码 。 对 用 汇编 语言 编写 的 
内 容 ， 本 书 只 介绍 了 启动 处 理 和 上 下 文 切换 处 理 。 本 书 中 没有 介绍 的 
代码 希望 读者 能 够 自己 去 分 析 理 解 。 

另外 ， 考 虑 到 相关 内 容 已 经 在 本 书 中 加 以 说 明 ， 因 此 在 登载 的 代码 中 
删除 了 UNIX V6 开发 者 加 入 的 注释 。 但 是 为 了 提高 可 读 性 ， 笔 者 还 是 
保留 了 一 部 分 原 注释 ， 同 时 也 加 入 了 一 部 分 新 的 注释 。 

本 书 旨 在 成 为 UNIX V6 内 核 源 代码 的 阅读 指南 。 如 果 想 完全 理解 内 核 
细节 ， 仅 阅读 本 书 的 说 明 部 分 是 不 够 的 ， 还 需要 深入 理解 书 中 涉及 的 
甚至 未 涉及 的 代码 。 

关于 代码 的 说 明 


本 书 按照 下 面 的 顺序 ， 从 抽象 程度 较 高 的 内 容 加 抽象 程度 较 低 的 内 容 
进行 讲解 。 


. 讲解 进程 或 文件 系统 等 功能 
. 讲解 实现 上 述 功 能 的 函数 或 结构 体 
.给 出 上 述 函 数 或 结构 体 的 代码 并 讲解 


为 了 便于 读者 阅读 ， 本 书 按照 下 述 格式 讲解 代码 。 根 据 需要 ， 在 有 些 
地 方 调整 了 代码 和 表格 的 讲解 顺序 。 


结构 体 的 讲解 


内 核 中 定义 了 一 些 重要 的 结构 体 ， 用 表格 的 形式 介绍 结构 体 的 成 员 
(代码 清单 2， 表 1 ) 。 在 代码 清单 标题 的 括 弧 中 ， 注 明了 定义 该 结构 


一 


[Be 


LUD 


体 的 文件 名 。 
讲解 的 过 程 统 一 采用 “结构 体 名 . 成员” 的 形式 表示 茶 个 构 亿 体内 的 成 


只 O 〇 


~ 


代码 清单 2 结构 体 示 例 (文件 名 ) 


I truce Houe 4 包含 结构 体 的 文件 名 


吕 int aaa; 

2 char bbb: 
4 ohare 
| char *ddd:; 
EE 
| 


Tb ed 


首先 以 表格 的 形式 讲解 参数 ( 表 2 ) ， 然 后 给 出 代码 和 每 行 的 讲解 
(代码 清单 3 ) 。 在 代码 清单 标题 的 括 弧 中 ， 注 明了 定义 该 范 数 的 文 
件 名 。 虽 然 此 处 的 例子 对 每 行 代码 都 做 了 详细 (其 实 没 有 必要 ) 的 说 
明 ， 但 如 果 代 码 本 身 是 无 需 解释 的 ， 或 事先 已 做 过 介绍 ， 那 么 在 代码 
清单 中 整 不 会 再 做 特别 说 明 。 


表 2 画 数 参数 示例 


代码 清单 3 ” 画 数 示例 (文件 名 ) 


1 hogehogelfuga) | 


3 


_ 

到 

4 1 le J 
ES return 也; 

旦 可 


3~5 ”返回 参数 fuga 与 10 相 加 的 结 

对 汇编 语言 代码 也 以 相同 的 方式 说 明 。 因 为 本 书 省 略 了 对 汇编 器 规格 
的 说 明 ， 所 以 如 果 有 读者 需要 简单 确认 PDP-11 指令 集 ， 请 见 附录 A.1 
的 [9]， 需 要 了 解 汇编 器 详细 信息 的 读者 详 见 附录 A.1 的 [20]。 

栈 的 说 明 


在 涉及 进程 拥有 的 栈 状态 时 将 用 表格 加 以 说 明 ( 表 3 ) 。 在 第 2 章 中 
会 提 到 ， 各 进程 的 栈 是 从 地 址 空间 的 最 高 位 开始 分 配 ， 向 低位 方向 增 


长 。 但 是 在 表格 里 位 于 上 方 的 行 表示 较 低 位 的 地 址 ， 也 吏 是 说 栈 在 表 
格 里 是 由 下 巾 上 增长 的 。 


表 3 栈 的 示例 


处 于 栈 顶 端 第 2 位 的 值 


寄存 器 


在 涉及 PDP-11 或 周边 设备 的 寄存 器 时 将 用 表格 加 以 说 明 ( 表 4) 。 对 
未 使 用 的 比特 位 不 做 介绍 。 


表 4 寄存 器 示例 


比 


状态 值 


| 


在 讲解 中 如 果 需 要 调用 寄存 器 的 某 一 位 ， 比 如 说 第 0 位 的 时 候 ， 会 
以 “寄存 右 名 [0]" 的 形式 标注 。 如 采 调 用 了 多 个 比特 位 ， 比 如 说 从 第 3 
位 到 第 1 位 的 时 候 ， 会 以 "寄存 融 名 [3-1]” 的 形式 标注 。 


数字 的 表示 形式 


UNIX V6 中 有 很 多 地 方 采用 了 八进制 数 。 为 了 避免 混 消 基 数 ， 在 介绍 
中 采用 了 如 下 的 表示 形式 。 

。 十 六 进 制 数 : 0x10 

。 十 进 制 数 : 16 

。 八进制 数 : 020 
对 二 进 制 数 则 直接 采用 01 或 10 的 形式 表示 。 尽 管 十 进 制 数 和 八进制 
数 的 表示 形式 比较 相似 ， 容 易 混 淆 ， 但 相信 读者 通过 上 下 文 还 是 可 以 


区 分 的 。 


男 外 请 注意 ，PDP-11 的 汇编 恬 对 不 带 前 级 的 数字 一 律 按 八进制 数 处 
理 。 


几 点 有 助 于 增进 理解 的 建议 


UNIX V6 内 核 源 代码 尽管 比较 适合 初次 阅读 代码 的 读 着 ， 但 是 仍然 有 
一 定 的 难度 。 笔 者 在 此 举 出 几 点 便于 读者 增进 理解 的 建议 ， 在 阅读 代 
码 过 到 困难 时 请 酌情 参考 。 


首先 通读 全 书 


首先 请 从 头 到 尾 通 读本 书 ， 和 擎 握 内 核 的 全 貌 。 在 理解 某 个 模块 的 代码 
时 ， 往 往 需要 对 相关 模块 有 所 了 解 。 前 面 已 经 说 过 ， 在 编排 章节 时 我 
尽量 将 相关 内 容重 前 说 明 ， 但 是 这 种 做 法 毕竟 还 是 有 局 限 性 的 。 在 阅 
读 中 中 到 难于 理解 的 内 容 时 ， 可 以 先 跳 过 它 ， 等 到 读 完全 书后 再 重读 
这 一 部 分 ， 这 可 能 是 一 个 比较 好 的 办 法 。 


阅读 规格 说 明 书 和 程序 员 手 册 


在 阅读 本 书 的 同时 ， 阅 读 规格 说 明 书 和 程序 员 手 册 有 助 于 加 深 理解 。 
不 要 通过 阅读 代码 去 理解 程序 规格 ,而 应 该 在 理解 规格 的 基础 上 再 去 阅 
读 代码 。 特 别 是 系统 调用 部 分 的 规格 非常 重要 。 内 核实 现 了 最 低 限度 
的 功能 ， 而 这 些 功能 是 通过 系统 调用 提供 给 用 户 程 序 的 ， 从 这 个 角度 
上 说 ， 将 系统 调用 的 规格 看 作 是 内 核 的 规格 也 并 不 过 分 。 


在 阅读 设备 驱动 程序 时 ， 最 好 也 读 一 下 该 设备 的 规格 说 明 书 。 设 备 驱 
动 程序 是 根据 设备 规格 进行 操作 的 ， 理 解 了 设备 规格 后 ， 对 理解 驱动 
程序 进行 的 操作 无 疑 会 有 帮助 。 


仔细 阅读 结构 体 


包括 系统 内 核 在 内 ， 程 序 的 主要 工作 就 是 操作 数据 。 因 此 ， 只 要 把 握 
了 作为 处 理 对 象 的 结构 体 ， 或 是 程序 中 出 现 的 标志 变量 (flag) ， 就 能 
大 致 推测 出 该 程序 的 处 理 内 容 。 


区 分 内 存 空间 地 址 


代码 中 涉及 内 存 地 址 的 部 分 ， 请 注意 区 分 该 地 址 指向 的 是 内 核 的 地 址 
空间 ， 还 是 用 户 程序 的 地 址 空间 。 


寻找 志同道合 的 朋友 


在 阅读 本 书 、Lions 书 ， 或 是 UNIX V6 内 核 源 代码 的 时 候 ， 组 织 读书 
会 是 一 个 很 好 的 方法 。 向 他 人 提出 自己 的 疑问 ， 或 是 向 他 人 介绍 自己 
理解 的 内 容 ， 这 都 会 加 深 对 内 容 的 理解 。 在 博客 上 写 出 自己 的 想法 和 
心得 也 是 一 个 很 好 的 方法 。 


本 书 的 写作 原委 和 谢 僚 


在 写本 书 之 前 ， 笔 者 对 操作 系统 的 大 概 情况 有 一 定 认识 ， 但 是 完全 不 
了 解 具体 的 实现 方法 ， 总 布 望 有 机 会 能 阅读 一 下 源 代 码 。 通 过 朋友 的 
介绍 接触 到 Lions' Commentary on UNIX 这 本 书 (也 就 是 通称 的 Lions 
书 ) ， 在 了 解 到 UNIX V6 的 源 代码 不 到 1 万 行 等 信息 后 ， 我 马上 就 对 
此 书 产生 了 兴趣 。 


但 是 ，Lions 书 问世 已 入， 写作 的 时 代 背 景 和 现在 相差 迎 异 ， 因 此 对 我 
而 言 很 难 理解 ， 阅 读 速度 非常 缓慢 。 此 时 ， 又 是 前 面 提 到 的 那 位 朋友 
回 我 介绍 了 一 个 关于 Lions 书 的 读书 会 ， 我 束 参 加 了 他 们 的 读书 活动 。 
在 读书 会 里 ， 通 过 请 教 对 内 核 比 较 熟 悉 的 成 员 ， 或 是 向 他 人 介绍 自己 
通过 预习 而 擎 握 的 知识 ， 慢 慢 加 深 了 对 UNIX V6 内 核 的 理解 。 


理解 了 系统 内 核 之 后 ， 我 上 学 时 学 到 的 计算 机 相关 知识 之 间 的 联系 吏 
在 头脑 中 逐渐 清晰 起 来 ， 同 时 也 切实 体会 到 目 己 在 这 个 领域 的 千 语 明 


显 地 提高 了 一 个 层次 。 


为 了 和 他 人 分 享 这 种 体验 ， 同 时 也 作为 学 习 的 备 生 未 ， 我 开始 在 博客 
上 记录 学 习 过 程 。 读 完了 Lions 书后 ， 博 客 的 连载 也 告 一 段落 后 ， 我 写 
了 一 篇 总 结 性 的 文章 ， 引 起 了 很 大 反 啊 。 


当 我 确信 读者 对 类 似 系统 内 核 这 种 《与 应 用 程序 相 比较 ) 底层 的 知识 
有 很 大 需求 之 后 ， 便 主动 向 出 版 社 毛 遂 目 存 ， 商 谈 以 博客 文章 为 基础 
出 版 图 书 的 事宜 ， 得 到 了 技术 评论 社 ”的 积极 回应 。 


”本 书 原著 的 出 版 社 。 一 一 译 者 注 


本 书 以 笔者 一 人 的 微薄 之 力 是 难以 完成 的 。 如 采 没 有 参加 读书 会 ， 和 是 
和 
示 司 1 六 


读书 会 成 员 大 野 微 先生 、 小 泽 广 先生 、 坂 顶 佑 树 先 生 、 高 野 了 成 先 

人生” 守 罗 区 坊 先 符 全 省 志和 允 生 二 攻 轩 十 例 作 生 > 细 川 全 六 重生 于 松 译 
俗 先 生 和 山本 英雄 先生 参与 了 本 书 的 审阅 工作 ， 为 笔者 提出 了 很 多 中 
肯 的 意见 。 一 想到 如 果 没 有 这 些 意 见 的 话 呈 现在 读者 面前 的 将 会 是 怎 
样 一 本 书 ， 不 免 有 些 后 怕 。 正 是 因为 大 家 的 帮助 ， 本 书 的 品质 得 到 了 
很 大 提高 ， 我 借 此 机 会 表示 感谢 。 


小 结 


i 


OU TD ee A a 
读 


。 在 理解 规格 说 明 书 和 手册 的 基础 上 上， 重复 阅读 本 书 和 内 核 源 代码 
将 会 加 深 理 解 


。 导 找 志同道合 的 朋友 十 分 重要 


第 I 部 分 什么 是 UNIX V6 


在 具体 介绍 代码 之 前 ,首先 会 讲解 UNIX V6 的 一 些 基本 概念 。 
。 UNIX V6 内 核 具 有 哪些 功能 
。 内 核 如 何 向 用 户 程序 提供 功能 
。 运行 UNIX V6 的 系统 由 怎样 的 硬件 构成 

了 解 了 上 述 概 念 ,对 理解 内 核 源 代码 一 定 会 有 帮助 。 


第 1 章 UNIX V6 的 全 钢 


1.1 什么 是 UNIX V6 


UNIX V6 由 肯 : 汤 普 逊 (Kenneth Lane Thompson) 和 丹尼斯 :里 奇 


(Dennis MacAlistair Ritchie) 开发 ， 由 贝尔 实验 室 于 1975 年 发 布 。 


因为 大 部 分 代码 都 是 用 C 语言 完成 的 ， 并 且 公开 了 源 代 码 ， 所 以 包括 
大 学 在 内 的 使 用 者 纷纷 将 其 移植 到 目 己 的 环境 中 ，UNIX V6 因此 得 到 
广泛 使 用 。 在 移植 过 程 中 ， 有 些 开 发 人 员 加 入 了 独 有 的 功能 ， 其 中 一 
些 功能 后 来 也 被 原始 版 本 所 采纳 。 


从 UNIX V6 派生 出 来 的 产品 还 有 很 多 ， 但 是 本 书 以 其 原始 版 本 , 即 在 
DEC 公司 的 PDP-11/40 设备 上 运行 的 系统 内 核 作 为 说 明 对 象 。 


1.2 UNIX 的 历史 


贝尔 实验 宇 在 发 布 UNIX V6 之后， 于 1979 年 又 发 布 了 UNIX 第 7 版 
(Seventh Edition Unix，UNIX V7 ) 。 加 州 大 学 伯克利 分 校 于 1978 年 

发 布 了 以 UNIX V6 为 基础 的 BSD 的 首 个 版 本 。 在 此 之 后 ，UNIX 和 

BSD 不 断 有 新 版 本 或 派生 版 本 出 现 。 然 后 又 出 现 了 标准 化 的 动向 ， 制 


定 了 POSIX 标准 ， 意 在 统一 各 个 操作 系统 所 提供 的 API。 著 名 的 
Linux 也 是 将 POSIX 标准 作为 开发 目标 的 。 因 此 ， 大 多 数 最 新 的 操作 
系统 都 和 UNIX (V6 ) 有 着 千 丝 万 缕 的 联系 。 


UNIX 的 历史 如 图 1-1 所 示 。 


(oF) 
1969 


0 ay 本 


总 号 
i 
EE ES 8 8 S888 S28 3 3 :0 

时 怪 


et 入 
Eo BSS 8 8 S8238 3 31 
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图 片 : Eraserhead1, Infinity0 (Own work: CC-BY-SA-3.0, GFDL) 
图 1-1 UNIX 的 历史 1 


| 1 http://ja.wikipedia.org/wiki/UNIX 


1.3 UNIX V6 内 核 

UNIX V6 内 核 提 供 了 这 些 操作 系统 所 必须 具备 的 如 下 基本 功能 
。 管 理 运行 中 的 程序 (进程 ) 

。 内 存 管理 


。 文 件 系统 
。 文 件 和 周边 设备 共享 IO 
。 中 断 

。 支 持 终端 处 理 


内 核 向 用 户 提供 了 经 过 高 度 抽象 的 服务 。 系 统 对 CPU 或 磁盘 的 操作 细 
节 被 内 核 或 设备 驱动 程序 隐藏 起 来 ， 对 用 户 完全 透明 。 


用 户 程序 通过 系统 调用 机 制 访问 内 核 提 供 的 功能 。 构 成 计算 机 系统 的 
软件 集合 如 图 1-2 所 示 。 应 用 程序 利用 UNIX V6 提供 的 系统 内 置 的 用 
户 程序 集 (处 理 用 户 登 录 的 程序 ， 或 是 守护 程序 等 ) 、 辅 助 程序 ( 例 
如 1s、cat 等 ) 、 程 序 库 等 进行 处 理 。 系 统 程序 等 则 利用 系统 调用 
(调用 内 核 提 供 的 功能 ) 进行 自身 的 处 理 。 此 外 ， 应 用 程序 也 可 以 直 


接 使 用 系统 调用 。 


调用 程序 库 函 数 、 应 用 程序 


执行 命令 和 
程序 库 、 系 统 程序 等 四 系统 调用 
内 核 


图 1-2 构成 UNIX V6 的 软件 集合 

内 核 集 中 了 对 系统 影响 较 大 的 处 理 ， 通 过 限制 用 户 任意 执行 这 些 功 
能 ， 使 系统 的 安 全 性 和 可 维护 性 得 以 保证 。 

1.4 构成 UNIX V6 运行 环境 的 硬件 


本 节 对 构成 UNIX V6 运行 环境 的 硬件 进行 介绍 。 这 里 说 明 的 内 容 将 贡 
穿 以 后 的 各 章 ， 请 读者 注意 理解 。 


PDP-11 


PDP-11 系列 是 由 数字 设备 公司 (Digital Equipment Corporation，DEC) 
? 设计 制造 的 处 理 装置 。 本 书 内 容 以 PDP-11/40 为 对 象 (图 1-3 ) 。 


上? 美国 计算 机 企业 。 于 1998 年 被 康 柏 公司 (Compaq) 收购 ， 随 后 康 柏 公司 又 与 惠普 公司 


(Hewlett Packard) 合并 


下 ailtal 全 和 


照片 : Stefan_K6Ogl( GFDL ) 
图 1-3 PDP-11/40 3 


| 3 http://ja.wikipedia.org/wiki/PDP-11 


PDP-11/40 作为 一 种 16 位 计算 机 ， 指 令 和 数据 基本 都 是 以 16 比特 为 单 
位 进行 处 理 的。 处 理 器 处 理 数据 的 单位 称 为 字 (word) 。 对 PDP-11/40 
而 言 ,1 个 字 的 宽度 为 16 比特 。 


PDP-11/40 没有 专用 的 IO 总 线 ， 而 是 使 用 一 种 名 为 Unibus 的 总 线 用 于 
数据 的 输入 输出 ，Unibus 同时 具有 18 比特 宽 的 地 址 总 线 4。PDP- 
11/40 以 及 周边 设备 的 寄存 器 被 映射 到 内 存 最 高 位 的 8KB 空间 ， 因 此 可 
以 采用 与 操作 内 存 相 同 的 方法 操作 寄存 器 。 这 种 方式 被 称 为 内 存 映 射 
LO _ (Memory Mapped10) (图 1-4) 。 


4Unibus 总 线 共有 72 条 信号 线 ， 其 中 有 18 条 用 于 传输 地 址 (地 址 总 线 ) ， 另 有 16 条 用 于 传 
输 数 据 (IO 总 线 ) 。 主 


译 者 注 


内 存 地 址 


Unibus 


设备 的 寄存 器 被 映射 到 内 存 最 高 位 的 
8KB 空 间 。 通 过 操作 内 存 来 达到 访问 
寄存 器 的 目的 ( 内 存 映射 |/O ) 


= 
图 1-4 通过 Unibus 进行 连接 的 设备 


利用 内 存 有 映射 WO， 可 以 用 C 语言 将 寄存 亏 的 操作 写成 如 代码 清单 1-1 
所 示 的 形式 。integ 的 含义 请 参见 本 书 的 附 邓 。 


代码 清单 1-1 寄存 器 的 操作 示例 


/* 寄存 器 被 映射 的 地 址 */ 
#define REG_ADDRESS 0170000 


int Integ 


1 

2 

3 

4 struct { 
5 

6 }; 

7 


8 main() { 


9 int a; 

10 a = REG_ADDRESS->integ; /* 从 寄存 器 读 取 数 据 */ 
11 REG_ADDRESS->integ = 0; /* 向 寄存 器 写 入 数据 */ 
12 } 


PSW 


PDP-11/40 拥有 一 个 被 称 为 处 理 器 状态 字 (Processor Status Word ， 
PSW) 的 16 位 的 寄存 器 ( 表 1-1) 。PSW 表示 处 理 器 的 状态 。 


表 1-1 PSW 


处 理 器 当前 模式 (00 : 内 核 模式 、11 : 


于 前 策 式 (00 内核 式 1 


处 理 器 优先 级 〈7~-0) 


人 执行 结果 大 


° 洲 出 位 。 指 令 执行 中 发 生 溢 出 时 置 1 


旨 令 执行 中 发 生 进 位 或 借 位 时 置 1 


处 理 器 模式 为 00 时 表示 内 核 模式 ， 为 11 时 表示 用 户 模 式 ?。 在 对 系统 
调用 等 进行 处 理 时 ， 处 理 器 需要 首先 从 用 户 模 式 切换 到 内 核 模 式 。 内 
核 模式 和 用 户 模 式 所 使 用 的 进程 的 虚拟 地 址 空间 是 相互 独立 的 ， 因 此 
Es 竺 两 种 模式 则 传输 数据 时 ， 需 要 了 解 处 理 絮 当前 模式 和 处 理 器 先前 模 
工 


5 在 一 些 资料 中 , “内核 模式 ”也 译 为 “核心 态 ”， “用户 模式 ”也 译 为 < 用 户 态 ”。 审 校 者 注 


PSW[3-0] 会 根据 指令 的 执行 结果 自动 设置 。 关 于 处 理 器 优先 级 和 陷入 
位 将 在 第 5 章 做 详细 说 明 。 


通用 寄存 器 

PDP-11 具有 r0~r7 共 8 个 通用 寄存 右 。 其 中 只 有 r6 为 两 个 ， 分 别 对 应 
用 户 模 式 和 内 核 模 式 。 在 切换 PSW 的 当前 模式 时 ,r6 在 硬件 上 也 会 自 
动 切换 。 

UNIX V6 通用 寄存 器 的 用 途 如 表 1-2 所 示 。 

表 1-2 通用 寄存 器 


本 地 处 理 


帧 指针 ， 环 境 指针 


上 表 中 的 r5、r6、r7 对 理解 UNIX V6 内 核 尤其 重要 。 


r5 称 为 帧 指针 或 环境 指针 。 在 第 3 章 中 会 做 详细 介绍 。 
r6 称 为 栈 指针 ， 它 指 疝 各 进程 所 拥有 的 栈 的 顶端 。 


17 称 为 程序 计数 器 。 处 理 絮 从 17 指示 的 内 存 地 址 读 取 指 令 ， 随 后 解释 
并 执行 该 指令 。 处 理 完成 后 77 将 指 同 容纳 下 一 条 指令 的 内 存 地 址 。 


MMU 


内 存 管理 单元 (MMU，Memory Management Unit) 用 于 地 址 变换 以 及 
访问 权限 管理 。PDP-11/40 以 长 度 为 8KB 的 段 (segment) 或 页 

(page) 为 单位 ， 对 进程 所 需 的 内 存 进 行 管理 。 试 图 访问 不 具备 权限 
的 内 存 时 ，MMU 会 引发 一 个 陷入 异常 〈 参 见 第 5 章 ) 。MMU 通过 称 
为 APR 的 寄存 器 〈 页 寄存 器 ) 对 各 段 进 行 设 定 ， 并 将 虚拟 地 址 转换 为 
物理 地 址 。APR 和 地 址 变换 的 详情 会 在 第 2 章 中 介绍 。 


PDP-11/40 的 MMU 具有 两 个 状态 寄存 器 (Status Register) SR0 和 
SR2。SR0 用 于 保存 出 错 信息 和 内 存 管 理 的 有 效 标志 ( 表 1-3 ) 。SR2 
用 0 16 位 虚拟 地 址 ， 可 用 来 确定 引起 错误 的 指令 ( 表 
1-4) 。 


表 1-3 SR0 


es 
访问 设 定 错误 的 页 时 置 1 


1 PDR (详细 请 参见 第 2 章 ) 规定 的 页 长 度 以 外 的 区 域 时 置 1 


~、 记 区 域 写 入 数 时 , 


标 指令 的 16 位 虚拟 地 址 。 当 读 取 指令 失败 时 SR2 的 值 不 更 新 。 
果 SR0[15-13] 的 任意 1 位 为 1 时 SR2 的 值 也 不 更 新 


内 存 


PDP-11/40 使 用 的 内 存 被 称 为 磁 芯 内 存 (Magnetic Core Memory) ， 当 
时 的 论文 等 有 时 将 其 称 为 磁 芯 (Core) ， 本 书 为 了 便于 读者 理解 ， 仍 
将 其 称 为 内 存 。 


内 存 以 8 比特 (1 字 节 ) 为 单位 赋予 地 址 。 地 址 长 度 为 18 比特 ， 因 此 
内 存 容量 为 218 =256KB。PDP-11/40 将 周边 设备 的 寄存 器 映射 到 内 存 高 
位 8KB 的 地 址 空间 。 

处 理 器 利用 内 存 中 存储 的 指令 和 数据 进行 运算 。 

块 设备 

磁盘 设备 或 磁带 设备 等 块 设 备 可 以 容纳 大 量 数据 。 文 件 系统 构筑 于 块 
设备 之 上 。 对 块 设备 IO 处 理 的 介绍 参见 第 7 章 、 第 8 章 ， 对 文件 系统 
的 详细 说 明 参 见 第 9 章 、 第 10 章 。 


块 设备 的 一 部 分 被 用 做 交换 空间 。 为 了 在 有 限 容 量 的 内 存 中 运行 大 量 
程序 ， 内 核 会 把 不 需要 的 数据 从 内 存 转移 到 交换 空间 ， 或 者 将 需要 的 


数据 从 交换 空间 移 回 内 存 。 这 被 称 为 交换 处 理 ， 在 第 4 章 中 会 对 此 进 
行 详细 说 明 。 


行 式 打 印 机 
行 式 打印 机 用 于 在 纸张 上 打印 数据 的 设备 。 对 行 式 打印 机 的 说 明 请 见 


第 12 章 。 

终端 

终端 是 连接 系统 与 用 户 的 装置 。 用 户 可 以 通过 终端 对 系统 进行 交互 式 
的 操作 。 终 端 处 理会 在 第 13 章 中 说 明 。 

1.5 ”代码 

UNIX V6 源 代 码 对 应 现在 的 BSD 许可 证 ， 用 户 可 以 在 网 上 获取 代码 。 
本 书 附录 中 介绍 了 登载 UNIX V6 源 代码 的 网 站 中 。 


1.6 手册 


UNIX V6 向 用 户 提 供 了 名 为 UNIX Programmers Manual (UPM) 的 手 
册 。 该 手册 包括 下 述 9 个 章节 ， 阅 读 内 核 代码 时 需要 特别 注意 第 2 章 
和 第 4 章 。 如 果 和 希望 了 解 可 执行 程序 (a.out) 的 格式 请 参考 第 5 章 。 
本 书 在 希望 读者 参考 UPM 的 某 个 章节 〈 比 如 第 2 章 ) 时 ,会 

以 *<UPM(2)” 的 形式 标注 。 如 果 在 阅读 代码 时 遇 到 难以 理解 的 内 容 ， 也 
请 参考 UPM 。 

1. 手册 概要 

全 到 

3. 系统 调用 

4.C 语言 库 函 数 等 

5. 特殊 文件 5 、 设 备 驱 动 


6 关于 特殊 文件 的 说 明 请 参照 7.1 节 。 一 一 译 者 注 


6. 文件 格式 

7. 游戏 等 

8. 其 他 

9. 系统 管理 命令 和 守护 程序 
如 果 想 了 解 内 核 以 外 的 、 系 统 内 置 的 用 户 程序 集 等 内 容 ， 请 参考 上 壕 


Pe 


第 1 章 ` 第 3 章 ` 第 5 章 ` 第 8 章 。 


本 书 附 录 中 介绍 了 登载 UNIX V6 手册 的 网 站 器。 


1.7 小 结 
。UNIX V6 由 肯 : 汤 普 逊 和 丹尼斯 .里 奇 开 发 ， 于 1975 年 由 贝尔 实验 
室 发 布 


UNIX V6 可 以 说 是 现代 操作 系统 的 鼻祖 
UNIX V6 的 内 核 提 供 了 系统 运行 所 必需 的 基本 功能 


内 核 回 用户 隐藏 了 对 硬件 的 操作 ， 以 及 保证 了 对 系统 具有 影响 的 
处 理 的 安全 性 和 可 维护 性 


用 户 程序 通过 系统 调用 辐 内 核发 出 处 理 请 求 
PDP-11/40 及 周边 设备 的 寄存 器 被 映射 到 内 存 的 最 高 位 8KB 地 址 


空间 


PDP-11/40 具有 r0~r7 的 8 个 通用 寄存 器 。 其 中 只 有 r6 又 分 为 两 
人 


第 开 部 分 进程 


内 核 将 执行 中 的 程序 作为 进程 加 以 管理 。 内 核 将 内 存 分 配给 进程 ,进程 
0 


。 内核 如 何 管 理 进程 

。 内 存 如 何 分 配给 各 个 进程 

。 进程 如 何 访问 被 分 配 到 的 内 存 

。 如 何 并 行 执行 多 个 进程 

。 如 何 有 效 利用 内 存 空间 
0 
虹 。 


第 2 章 进程 


2.1 进程 的 概要 

什么 是 进程 

内 核 采 用 进程 的 概念 对 执行 中 的 程序 进行 管理 。 一 个 进程 对 应 一 个 执 
行 中 的 程序 。 


在 执行 程序 时 ， 内 核 首 先 将 程序 (以 文件 系统 中 的 文件 (参见 第 9 
章 ) 等 形式 保存 在 磁盘 上 ) 读 入 内 存 ， 然 后 将 此 内 存 区 域 分 配给 进 
程 。 进 程 拥有 独立 的 虚拟 地 址 空间 ， 可 以 使 用 虚拟 地 址 空间 内 的 地 址 
(虚拟 地 址 ) ， 由 MMU 转换 为 实际 的 内 存 地 址 (物理 地 址 ) ， 访 问 


被 分 配 的 内 存 。 在 使 用 物理 地 址 管理 内 存 时 ， 本 书 有 时 也 将 内 存 称 为 
物理 内 存 。 


进程 具有 唯一 的 进程 ID。 由 于 是 以 ID 为 识别 手段 ， 因 此 即使 同一 程序 
被 执行 多 次 生成 多 个 进程 ， 内 核 也 将 其 识别 为 不 同 的 进程 。 此 外 ， 由 
于 内 存 以 进程 为 单位 分 配 ， 而 且 进 程 的 虚拟 地 址 空间 各 上 自 独立 ， 因 此 
各 个 进程 在 执行 时 不 会 相互 影响 (图 2-1 ) 。 由 于 程序 的 指令 在 执行 时 
` 会 发 生变 化 ， 因 此 从 节约 内 存 使 用 量 的 角度 出 发 ， 有 时 也 会 将 同一 
块 内 存 分 配给 多 个 进程 的 虚拟 地 址 空间 。 

物理 内 存 物理 地 址 进程 A 的 


虚拟 地 址 空间 
虚 el 


Se 进程 B 的 
、 虚拟 地 址 空间 
二 虚拟 地 址 
0 


a 进程 C 的 
、、 虚拟 地 址 空间 
虚拟 地 址 

0 


图 2-1 相互 独立 的 虚拟 地 址 空间 
进程 的 并 行 执行 


UNIX V6 可 供 多 名 用 户 同时 使 用 。 每 名 用 户 可 同时 执行 多 个 程序 ， 
此 在 任意 时 刻 ， 系 统 中 都 可 能 存在 多 个 进程 (图 2-2) 。 


图 2-2 系统 中 存在 多 个 进程 

但 是 ， 系 统 中 用 来 处 理 程序 的 物理 CPU 只 有 一 个 ， 因 此 即使 存在 多 个 
Ee . 人 一 个 ， 其 他 的 进程 处 于 待机 
状态 2-3 


执行 中 的 进程 
待机 中 的 进程 
图 2-3 可 执行 的 进程 只 有 1 个 
内 核 会 随时 切换 执行 中 的 进程 ， 将 时 间 片 分 给 不 同 的 进程 。 这 样 的 


话 ， 即 使 只 有 1 个 物理 CPU, 也 可 以 并 行 处 理 多 个 程序 。 采 用 这 种 方式 
的 系统 被 称 为 分 时 系统 (Time Sharing System，TSS) (图 2-4) 。 


进程 1 进程 2 进程 3 时 间 ] 


时时 执行 中 的 进程 


图 2-4 TSS 


尽管 在 任意 时 刻 都 只 存在 1 个 执行 中 的 进程 ， 但 是 通过 在 很 短 的 时 间 
间隔 中 不 断 切 换 执行 中 进程 的 方式 ， 使 用 户 产 生 多 个 程序 在 同时 运行 
的 错觉 。 在 以 后 的 说 明 中 ， 将 当前 执行 中 的 进程 称 为 执行 进程 。 


进程 的 执行 状态 


进程 的 执行 状态 可 以 分 为 两 种 : 可 执行 状态 和 休 眼 状态 。 进程 在 等 待 
其 他 资源 被 释放 或 等 待 周边 设备 处 理 结束 时 ， 会 暂时 中 断 目 身 的 处 
理 ， 进 入 休眠 状态 。 内 核 从 处 于 可 执行 状态 的 进程 中 选择 1 个 作为 执 
行进 程 运行 (图 2-5) 。 


i “is 


a 
可 执行 状态 N 
AT 
多 ! 
1 


站 1 执行 中 
/ ¥ 待机 中 
! ”大 于 等 于 0 个 ,大 于 等 于 0 个 
1 / 

a CE 休眠 状态 


一 一 NE 


图 2-5 ”进程 的 执行 状态 
用 户 模 式 和 内 核 模 式 


如 第 1 章 所 述 ， 处 理 器 具有 两 种 模式 ， 用户 模式 和 内 核 模 式 。 通 过 
PSW 能 够 在 两 普 间 进行 切换 。 


切换 模式 时 ， 了 映射 到 虚拟 地 址 的 物理 内 存 区 域 也 随 之 发 生变 换 。 虚 拟 
地 址 在 用 户 模 式 时 映 冉 到 用 户 程序 的 内 存 区 域 ， 在 内 核 模式 时 则 映射 
到 内 核 程序 的 内 存 区 域 (图 2-6 ) 。 内 存 映 射 的 切换 由 MMU 来 实现 。 
另外 ， 内 核 程序 在 系统 局 动 时 被 读 取 到 内 存 中 ， 详 细 说 明 请 参照 第 14 
音 。 


物理 内 存 内 核 程序 在 系统 启动 时 读 


取 到 内 存 中 。 访 问 内 核 程 
内 核 程 序 序 前 必须 切换 到 内 核 模式 


进程 人 的 
虚拟 地 址 空间 


处 理 器 模式 的 切换 
伴随 着 虚拟 地 址 对 
应 的 物理 内 存 区 域 
的 切换 


进程 B 的 
虚拟 地 址 空间 


图 2-6 用 户 模式 和 内 核 模式 


在 以 后 的 说 明 中 ， 将 用 户 模 式 时 的 虚拟 地 址 空间 称 为 用 户 空 间 ， 内 核 
模式 时 的 虚拟 地 址 空间 称 为 内 核 空间 。 此 外 ， 将 以 用 户 模 式 运 行 的 进 
程 称 为 用 户 进程 ， 以 内 核 模式 运行 的 进程 称 为 内 核 进程 。 


因为 用 户 程 序 由 用 户 进 程 处 理 ， 所 以 无 法 访问 加 载 内 核 程 序 的 内 存 区 
域 ， 也 就 无 法 执行 由 内 核实 现 的 功能 。 为 了 访问 内 核 功 能 ， 用 户 程序 
必须 通过 系统 调用 向 内 核 提 出 访问 内 核 功能 的 请 求 。 系 统 调 用 一 旦 被 
执行 后 ， 处 理 器 的 模式 将 切换 到 内 核 模式 ， 同 时 虚拟 地 址 空间 也 会 被 
切换 到 内 核 空间 ， 内 核 功 能 随 之 被 执行 。 内 核 处 理 结束 后 ， 处 理 器 的 
模式 返回 到 用 户 模 式 ， 继 续 做 一 般 处 理 。 如 上 所 述 ，1 个 程序 (进程 ) 
的 处 理 伴随 着 在 用 户 模式 和 内 核 模 式 之 间 的 多 次 切换 (图 2-7) 。 


进程 的 处 理 示例 
用 户 模式 内 核 模式 


对 内 核发 出 处 理 请 求 
并 切换 至 内 核 模式 


内 核 处 理 


返回 用 户 模式 


图 2-7 进程 处 理 示 例 


内 核 提 供 的 功能 通常 会 对 系统 造成 很 大 影响 。 如 采 放 任用 户 程 序 随意 
使 用 内 核 功能 会 造成 各 种 各 样 的 问题 。 通 过 制定 规则 强制 用 户 程序 使 
用 内 核 功能 时 必须 提出 申请 ， 使 系统 的 安全 性 得 以 提高 。 同 时 也 使 用 
户 程序 开发 人 员 在 编写 程序 时 无 需 对 内 核 的 实现 细节 有 过 多 了 解 。 


在 系统 调用 等 处 理 中 ， 会 出 现 需要 在 用 户 空间 和 内 核 空间 之 间 交 换 数 
据 的 情况 。 为 此 系统 提供 了 以 下 用 于 在 用 户 空 间 和 内 核 空间 之 间 读 写 
数据 的 函数 : fubyte() 、fuibyte()、fuword() 、fuiword() 
~ subyte() 、suibyte() 、suword() 、Suiword() 。 


交换 处 理 


随 着 进程 数量 的 增多 会 导致 内 存 容 量 不 足 。 内 核定 期 将 处 于 休 眼 状 

态 、 重 要 度 较 低 的 进程 (所 需 的 数据 ) 会 从 内 存 转移 到 交换 空间 
(swap out， 换 出 ) ， 或 者 将 交换 空间 中 已 处 于 可 执行 状态 的 进程 重新 

恢复 到 内 存 (swap in， 换 入 ) 。 这 个 处 理 被 称 为 交换 处 理 ， 由 系统 启 

动 时 生成 的 进程 执行 。 


2.2 proc 结构 体 和 user 结构 体 


进程 的 状态 信息 和 控制 信息 等 由 proc 结构 体 和 user 结构 体 管理 。 
个 进程 各 目 会 被 分 配 1 组 上 述 结构 体 的 实例 。proc 结构 体 常 驻 内 存 ， 
而 user 结构 体 有 可 能 修 移 至 交换 空间 。 


proc 结构 体 


由 proc 结构 体 构成 的 数组 proc[] (代码 清单 2-1 ) 中 的 每 个 元 素 分 
别 对 应 一 个 进程 。proc 结构 体 管理 着 在 进程 状态 、 执 行 优 先 级 等 与 进 
程 相关 的 信息 中 需要 经 常 被 内 核 访 问 的 那 部 分 信息 ( 表 2-1) 。 


举例 来 说 ， 内 核 在 (进程 切换 过 程 中 ) 选择 下 一 个 将 被 执行 的 进程 
时 ， 会 首先 检查 所 有 进程 的 状态 。 这 种 需要 遍历 所 有 进程 的 情况 在 其 
他 处 理 中 也 会 经 常 出 现 。 由 于 proc[] 常 驻 内 存 ， 因 此 内 核 可 以 在 很 
短 时 间 内 完成 对 所 有 进程 状态 的 检查 。 假 如 proc[ ] 能 够 被 移 至 交换 
空间 ， 内 核 必须 访问 交换 空间 才能 取得 相应 数据 ， 这 会 导致 化 费 过 多 
时 间 并 引起 性 能 下 降 。 


proc[] 的 长 度 决 定 了 在 系统 中 可 以 同时 存在 的 进程 上 限 。proc[] 的 
长 度 由 常量 NPROC 定义 ， 其 值 为 50 (代码 清单 2-2) 。 


代码 清单 2-1 proc 结构 体 (proc.h) 


1 struct proc 

2 

3 char p_stat; 
4 char p_flag; 
5 char p_pri; 
6 char p_sig; 
7 char p_uid; 
8 char p_time; 


9 char p_cpu 


10 char p_nice; 
11 int p_ttyp; 
12 int p_pid; 

13 int p_ppid; 
14 int p_addr; 
15 int p_size; 
16 int p_wchan; 
17 int *p_textp; 
18 } proc[NPROC]; 

19 


20 /* stat codes */ 
21 #define SSLEEP 
22 #define SWAIT 
23 #define SRUN 

24 #define SIDL 

25 #define SZOMB 
26 #define SSTOP 


ORODP 


28 /* flag codes */ 

29 #define SLOAD 01 
30 #define SSYS 02 
31 #define SLOCK 04 
32 #define SSWAP 010 
33 #define STRC 020 


34 #define SWTED 040 


代码 清单 2-2 NPROC (param.h) 


1 #define NPROC 


表 2-1 proc 结构 体 


于 NULL 时 意味 着 proc[] 数组 中 该 元 素 为 空 。 参 见 表 2-2 


级 越 高 ， 下 次 被 执行 的 可 能 性 也 束 越 大 


为 存 或 交换 空间 内 存在 的 时 间 ( 秒 ) 


| CPU 的 累计 时 间 (时 钟 tick 数 ) 


氏 执行 优先 级 的 补正 系数 。 缺 省 值 是 0， 通过 系统 调用 nice 可 以 
用 户 希 望 的 数值 


数据 段 的 物理 地 址 (单位 为 64 字 节 ) 1 


数据 段 的 长 度 (单位 为 64 字 节 ) 


进程 进入 休眠 状态 的 原 


的 代码 段 (text segment) 


1 进程 图 像 包 括 两 部 分 ， 一 部 分 是 常 驻 内 存 图 像 ， 如 proc[] ; 另 一 部 分 是 可 交换 图 像 


(swappable image) ， 如 PPDA 


、 数据 区 域 、 栈 区 域 等 ， 这 一 部 分 可 以 被 交换 到 磁盘 上 。 


p_addr 是 指向 进程 的 可 交换 图 像 在 内 存 或 磁盘 上 的 地 址 。p_size 是 进程 可 交换 图 像 的 大 小 。 


审 校 者 注 


表 2-2 进程 的 状态 


先 级 休眠 状态 。 执 行 优先 级 为 负 值 


和 完 级 休眠 状态 。 执 行 优先 级 为 0 或 正 值 


表 2-3 进程 的 标志 常量 


被 换 出 至 交换 空间 ) 


SLOAD | 进程 度 


系统 进程 ， 不 会 被 换 出 至 交换 空间 。 在 UNIX V6 中 只 有 proc[9] 是 系统 


进程 


进程 调度 锁 。 不 允 六 


F 进 程 图 像 被 换 出 至 交换 空间 


时 像 已 被 换 出 至 交换 空间 。 由 于 被 换 出 至 交换 空间 ，user,u_rsav[] 
“再 有 效 。 必须 从 user.u_ssav[] 中 恢复 75 、r6 的 值 


于 被 跟踪 状态 


SWTED | 在 被 跟 踩 时 使 用 


user 结构 体 


user 结构 体 (代码 清单 2-3、 表 2-4 ) 用 来 管理 进程 打开 的 文件 或 目 
录 等 信息 。 由 于 内 核 只 需要 当前 执行 进程 的 user 结构 体 ， 因 此 当 进 
程 被 换 出 至 交换 空间 时 ， 对 应 的 user 结构 体 也 会 被 移出 内 存 。 


代码 清单 2-3 ”user 结构 体 (user.h) 


1 struct user 

2{ 

3 int u_rsav[2]; 

4 int u_fsav[25]; 

5 char u_segflg; 

6 char U_error ， 

7 char U_UId ， 

8 char u_gid; 

9 char U_ruid 
10 char u_rgid; 
得 业 int u_procp; 
12 char *U_base ， 
13 char *U_Count 
14 char *u_offset[2]; 
15 int *yu_cdir; 
16 char u_dbuf [DIRSIZ]; 
17 char *u_dirp; 


18 struct { 


LU_ 


int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
int 
char 


/* U_err 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 


int U_ino; 


char u_name [DIRSIZ]; 


dent; 
*u_pdir; 
u_uisa[16] 
u_uisd[16] 


u_ofile[NOFILE]; 


u_arg[5]; 
U_tsize; 
uUu_dsize; 
U_Sssize; 
u_sep; 
u_qsav[2]; 
u_ssav[2]; 


u_signal[NSIG]; 


U_utime; 
uU_stime; 


了 


于 


u_cutime[2]; 
u_cstime[2]; 


*U_arg0 ， 
u_prof[4]; 
u_intflg; 


or codes */ 
EFAULT 
EPERM 
ENOENT 
ESRCH 
EINTR 
EIO 
ENXIO 
E2BIG 
ENOEXEC 
EBADF 
ECHILD 
EAGAIN 
ENOMEM 
EACCES 
ENOTBLK 
EBUSY 
EEXIST 
EXDEV 
ENODEV 
ENOTDIR 
EISDIR 
EINVAL 
ENFILE 
EMFILE 
ENOTTY 
ETXTBSY 
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70 #define 
71 #define 
72 #define 
73 #define 
74 #define 
75 #define 


表 2-4 user 


El 
号 全 
号 全 


u segflg | 记 


U_error 


u_uid Si 
u_gid Si 


u_ruid 


*u_procp 
*u_base 


EFBIG 
ENOSPC 
ESPIPE 
EROFS 
EMLINK 
EPIPE 


结构 体 


进程 切换 时 用 


的 标志 变量 


口 


口 


此 user 结 


读 写 文件 时 用 了 


(real user) ID 


(real group) ID 


本 对 应 的 数组 


lk 存 错 误 代码 。 


参见 表 2-5 


( effective user) * ID 


(effective group) ID 


proc[] 的 元 素 


Cn|aszn 国 
et i 录 对 应 的 数组 i 
ee namei() 使 用 的 临时 工作 变量 ， 用 来 存放 文件 和 目录 和 
企 记 户 程序 或 内 核 程序 传 来 的 文件 的 路 径 名 时 使 


dant | 供 画 数 namei() 使 用 的 临时 工作 变量 ， 用 来 存放 目录 数据 。u_ino 存放 
Ee inode 编号 ，u_name 存放 文件 和 目录 名 


函数 namei( ) 存放 对 象 文件 和 目录 的 父 
数据 区 域 的 长 度 (单位 为 64 字 节 ) 
区 域 的 长 度 (单位 为 64 字 节 ) 


处 理 器 为 PDP-11/40 时 此 项 基本 为 0 


_qsav[] | 在 系统 调用 处 理 中 处 理 信号 时 用 来 保存 上 和 zr6 的 当前 值 


当 进 程 被 换 出 至 交换 空间 ， 导 致 user,u_rsav[] 的 值 不 ] 
存 r5 和 Fr6 的 当前 值 


u_ssav[] 


u_signal[] | 用 于 设置 收 到 信号 后 的 动作 


u_utime ] 户 模式 | CPU 的 时 间 (时 钟 tick 数 ) 


u_stime ”| 内核 模式 下 占用 CPU 的 时 间 (时 钟 tick 数 ) 


u_cutime[] | 子 进 程 在 用 户 模式 CPU 的 时 间 (时 钟 tick 数 ) 


u_cstime[] | 子 进程 在 内 核 模式 下 占用 CPU 的 时 间 (时钟 tick 数 ) 


系统 调用 处 理 中 ， 操 作用 户 进程 的 通用 寄存 器 或 PSW 时 使 用 


u_prof[] 于 统计 ， 本 书 不 做 说 明 


u_intflg 变 于 判断 系统 调用 处 理 中 是 否 发 生 了 对 信和 号 的 处 理 


2 
[is 
普 
二 


， 实 效用 户 、 实 效 组 、 实 际 用 户 、 实 际 组 也 被 称 为 有 效用 户 、 有 效 组 、 真 实 


j 户 、 真实 组 。 以 实效 用 户 和 实际 用 户 为 例 ， 登 录 系 统 时 实际 用 户 束 已 经 确定 ， 比 如 是 


101。 车 用 这 个 用 户 运行 程序 ， 则 实效 用 户 为 101 ， 若 用 su 命令 以 超级 ] 户 身份 运行 ， 则 3 
j 户 为 0 (超级 用 户 ) ， 而 实际 用 户 仍 为 101。 ee 


表 2-5 错误 代码 3 


3 此 列表 中 对 错误 代码 的 有 些 描述 并 不 全 面 ， 请 谨慎 参考 。 审 校 者 注 


户 空 间 和 内 核 空 间 之 间 传 送 数 据 失 败 等 
号 的 目标 进程 不 存在 ， 或 者 已 结 

系统 调用 处 理 中 对 信号 做 了 处 理 

po IO 错误 


没 篇 所 示 没 备 不 在 在 
通过 系统 调用 exec 向 待 执 行程 序 传送 了 超过 512 字 市 的 参数 
无 法 识别 竺 执行 程序 的 格式 (魔术 数字 ，magic number) 


EBADF ”| 试图 操作 未 打开 的 文件 ， 或 者 试图 写 入 用 只 读 模 式 打开 的 文件 ， 
试图 读 出 用 只 写 模式 打开 的 文件 

执行 系统 调用 wait 时 ， 无 法 找到 子 进程 

ea amp 无 法 在 数组 proc[] 中 找到 空 元 素 


试图 向 进程 分 配 超过 可 使 用 容量 以 上 的 内 存 
没有 对 文件 或 目录 的 访问 权限 

执行 系统 调用 mount 、umount 时 ， 作 为 对 象 的 挂 载 点 仍 在 使 用 
执行 系统 调用 link 时 该 文件 已 经 存在 

试图 对 其 他 设备 上 的 文件 创建 连接 
设备 编号 所 示 设 备 不 存在 

不 是 录 
试图 对 目录 进行 写 入 操作 


EMEFILE 数组 user.u_ofile[] 滩 出 


2 
类 
不 


ENOTTY 是 代表 终端 的 特殊 文件 
PR 


5TxTpsY | 准备 加 载 至 代码 段 的 程序 文件 曾 被 其 他 进程 当做 数据 文件 使 用 。 或 者 
对 准备 加 载 至 代码 段 的 程序 文件 进行 了 写 入 操作 


EFBIG 
文件 尺寸 过 大 


块 设备 的 容量 不 足 


管道 文件 执行 了 系统 调用 
试图 更 新 只 读 块 设备 上 的 文件 或 目录 
损坏 的 管道 文件 


内 核 可 以 通过 全 局 变量 u 访问 执行 进程 的 user 结构 体 (代码 清单 2-4 
) ， 理 由 将 在 本 章 最 后 介绍 。 


2.3 ”为 进程 分 配 的 内 存 


代码 段 和 数据 段 作 为 两 个 连续 的 物理 内 存 区 域 被 分 配给 进程 。 进 程 通 
过 虚拟 地 址 访问 被 分 配 的 物理 内 存 区 域 。 


代码 段 


代码 段 是 只 读 的 ， 用 来 存放 作为 程序 指令 的 机 器 代码 。 某 个 程序 在 被 
同时 执行 多 次 时 ， 各 进程 共享 同一 个 代码 段 。 代 码 段 通过 数组 
text[] 进行 管理 ， 长 度 由 user .,u_tsize 表示 。 


数据 段 

数据 段 用 来 存放 程序 使 用 的 变量 等 数据 。 数 据 段 与 代码 段 的 不 同 之 处 
是 不 会 被 多 个 进程 共享 。 如 果 它 允许 被 共享 的 话 ， 某 个 进程 的 处 理 就 
会 被 别 的 进程 影响 。 


数据 段 的 物理 地 址 和 长 度 分 别 由 proc,.p_addr 和 proc.p_size 表 
示 。 数 据 段 从 低位 地 址 开始 ， 依 次 由 下 述 3 个 部 分 组 成 (图 2-8) 。 


user 结构 体 | -~------ i proc.p_addr 
内 核 栈 区 域 | ____--- > USIZE 
a 数据 区 域 User.u_dsize 
proc.p_size 
栈 区 域 User.u_ssize 
物理 内 存 
图 2-8 数据 段 


。 PPDA (Per Process Data Area) 
o User 结构 体 和 内 核 栈 区 域 构成 


o。 长 度 为 USIZEx64 字 节 =1KB (代码 清单 2-5) 。 从 用 户 空间 
无 法 访问 


代码 清单 2-5 USIZE (param.h) 


1 #define USIZE 16 


| 


o 内 核 栈 区 域 被 用 作 内 核 处 理 时 的 临时 工作 区 域 。 每 个 进程 都 
具有 供 内 核 模式 使 用 的 工作 区 域 


。 数据 区 域 
由 存放 全 局 变量 或 bss 等 静态 变量 的 区 域 和 进程 用 来 动态 管理 内 
存 的 堆 区 域 构 成 。 扩 展 堆 区 域 需 要 通过 系统 调用 来 完成 。 扩 展 从 
虚拟 地 址 的 低位 同 高 位 方向 进行 ， 长 度 由 user ,u_dsize 表示 。 
。 栈 区 域 


用 来 暂时 存放 函数 的 参数 或 局 部 数据 。 长 度 根据 需要 上 自动 扩展 。 
栈 区 域 的 扩展 从 虚拟 地 址 的 最 高 位 向 低位 方向 进行 ， 长 度 由 


user.u_ssize 表示 。 
虚拟 地 址 空间 
进程 拥有 64KB 的 虚拟 地 址 空间 ， 通 过 长 度 为 16 比特 的 虚拟 地 址 访问 
虚拟 地 址 由 MMU 转换 成 长 度 为 18 比特 的 物理 地 址 ( 表 2- 
0 O 


表 2-6 虚拟 地 址 空间 和 物理 地 址 空间 


i 


遍地 址 空间 16 比特 的 庶 反 地 直 
办 地 址 空间 18 比 条 的 和 理 地 直 


代码 段位 于 虚拟 地 址 空间 最 低位 的 地 址 ， 其 后 为 数据 区 域 ， 数 据 区 域 
J 为 边界 对 齐 。 栈 区 域 被 分 配 在 虚拟 地 址 空间 的 最 高 
YY. 2-9) 。 


虚拟 地 址 空间 


代码 段 | User.u_tsize 


数据 区 域 user.u_dsize 


El 数据 段 
2 


Oxffff 栈 区 域 “| > User.u_ssize 


图 2-9 进程 的 虚拟 地 址 空间 


每 个 进程 都 拥有 独立 的 虚拟 地 址 空间 。 举 例 来 说 ， 某 个 进程 的 虚拟 地 
址 A 和 其 他 进程 的 虚拟 地 址 A 所 指 回 的 物理 地 址 是 不 同 的 。 但 是 ， 进 
程 间 共享 代码 段 时 不 受 此 限制 (图 2-10) 。 
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/ 栈 区 域 
Oxffff > Oxffff 
进程 A 的 进程 B 的 
虚拟 地 址 空间 虚拟 地 址 空间 


Ox3ffff 


物理 地 址 空间 


图 2-10 物理 地 址 空间 和 虚拟 地 址 空间 


在 虚拟 地 址 空间 中 ， 数 据 区 域 和 栈 区 域 可 被 视 作 不 同 的 段 。 此 外 ， 正 
如 将 在 第 3 章 中 介绍 的 那样 ， 内 核 为 了 使 数据 区 域 和 栈 区 域 成 为 不 同 
的 段 (页 ， 对 APR 进行 了 设 定 。 因 此 ， 在 虚拟 地 址 空间 中 ， 也 可 以 
把 数据 区 域 和 栈 区 域 分 别称 为 数据 段 和 栈 段 。 本 书 为 了 和 物理 内 存 中 
按照 连续 地 址 分 配 的 数据 段 (PPDA+ 数据 区 域 + 栈 区 域 ) 加 以 区 分 ， 
在 以 后 的 说 明 中 还 是 统一 将 其 称 为 数据 区 域 和 栈 区 域 。 


使 用 虚拟 地 址 具有 以 下 优点 。 
程序 能 够 使 用 以 任意 地 址 为 起 点 的 内 存 空间 


每 个 程序 都 可 以 将 以 任意 地 址 为 起 点 的 内 存 空间 作为 自己 使 用 的 内 存 
区 域 ， 无 需 考 虑 该 虚拟 地 址 与 物理 地 址 的 对 应 关系 。 


另外 ， 尽 管 在 发 生 交 换 处 理 时 分 配给 进程 的 物理 地 址 会 发 生变 化 ， 但 
是 由 于 虚拟 地 址 始终 保持 不 变 ， 因 此 开发 人 员 在 编写 程序 时 无 需 考虑 


这 个 问题 。 
实现 对 内 存 访问 的 管理 


便于 实现 对 内 存 访 问 的 管理 。 如 果 程 序 能 够 直接 访问 物理 地 址 ， 也 就 

有 可 能 访问 其 他 进程 正在 使 用 的 物理 内 存 区 域 。 而 使 用 虚拟 地 址 ， 通 

人 
空间 的 独立 性 。 


此 外 ， 在 试图 访问 未 被 分 配给 目 己 的 内 存 区 域 ， 或 是 访问 不 具有 访问 
权限 的 区 域 时 ， 可 以 通过 MMU 触发 异常 ， 中 止 进 程 的 处 理 。 


提高 内 存 的 使 用 效率 


在 需要 确保 一 定 长 度 的 连续 的 内 存 区 域 时 ， 通 过 将 不 连续 的 物理 内 存 
区 域 映 射 到 连续 的 虚拟 内 存 区 域 ， 可 以 提高 物理 内 存 的 使 用 效率 。 但 
征 ， 对 UNIX V6 而 言 ， 代 码 段 和 数据 段 本 喘 与 连续 的 物理 内 存 区 域 相 
对 应 ， 系 统 并 未 进行 将 细小 的 物理 内 存 区 域 的 集合 映射 为 连续 的 虚拟 
地 址 区 域 的 处 理 。 


变换 地 址 


MMU 通过 APR (Active Page Register) 寄存 器 将 虚拟 地 址 变换 为 物理 
地 址 (图 2-11) 。1 个 APR 由 1 个 PAR (Page Address Register) 寄存 
器 ( 表 2-7) 和 1 个 PDR (Page Description Register) 寄存 器 ( 表 2-8 
) 构成 。 


用 户 进程 的 APR 的 值 保 存在 
User 结 构 体 中 。 当 进 程 执行 时 ， 
会 将 保存 在 user 结构 体 中 的 
值 设置 到 用 户 APR 中 


user 结构 体 


虚拟 地 址 


图 2-11 变换 地 址 


表 2-7 PAR 


基地 址 (以 64 字 节 为 单 代 


值 为 1 时 页 按 高 位 地 址 向 低位 地 址 的 方向 


页 的 访问 控制 方法 。00 : 未 分 配 、 


PDP-11/40 拥有 分 别 供 内 核 模式 和 用 户 模式 使 用 的 两 套 APR。 


通过 切换 PSW 的 当前 模式 (PSW[15-14]) ， 可 以 在 硬件 上 切换 MMU 
参照 的 APR， 从 而 达到 切换 虚拟 地 址 空 s 间 的 目的 (图 2-12) 。 


PSW 
15 14 13 0 


内 核 ( 00 ) 


图 2-12 APR 的 切换 


内 核 通 过 向 与 执行 进程 相对 应 的 、 供 用 户 进 程 使 用 的 APR 设 定 适 当 的 
值 ， 保 证 各 用 户 进 程 拥 有 独立 的 虚拟 地 址 空间 。 用 户 进 程 用 APR 的 值 
保存 在 user 结构 体 中 ， 当 该 进程 成 为 执行 进程 时 ， 会 将 保存 在 user 
结构 体 中 的 值 设 置 到 用 户 进程 用 APR 中 。 


APR 共有 8 组 ， 编 号 为 0 到 7。 进程 的 虚拟 地 址 空间 以 页 或 段 为 单位 
进行 管理 ，1 组 APR 对 应 1 页 。PAR 用 来 保存 与 各 页 物理 地 址 的 基地 
址 有 关 的 信息 PDR 用 来 保存 各 页 的 块 (以 64 字 节 为 单位 ) 数 以 及 是 
否 允 许 访问 等 信息 。 每 一 页 最 多 可 以 被 分 配 128 个 块 (8KB) 。 


虚拟 地 址 的 高 位 3 比特 决定 了 对 应 的 页 (APR) ，PAR 的 11~0 比特 决 
定 了 作为 物理 地 址 基地 址 的 块 地 址 ， 加 上 虚拟 地 址 的 12~6 比特 得 到 物 
理 内 存 的 块 地 址 ， 再 加 上 作为 块 内 偏 移 值 的 虚拟 地 址 的 5~0 比特 ， 就 
得 到 了 最 后 的 物理 地 址 (图 2-13 ) 。 


虚拟 地 址 
1s: ,1a .12 全 0 


PARI0] ~ [7] 


15 12 11 0 


物理 地 址 中 
17 6 5 0 
块 内 偏 移 值 


图 2-13 物理 地 址 的 计算 


内 核 之 所 以 可 以 通过 全 局 变量 u (0140000 ) 访问 执行 进程 的 user 结 

构 体 ,是 因为 内 核对 供 内 核 模 式 使 用 的 APR 做 了 相应 的 设 定 。 内 核 将 

内 核 模式 使 用 的 编号 为 6 的 PAR 设 为 执行 进程 的 数据 段 的 物理 地 址 
(proc.p_addr ) (图 2-14) 。 


内 核 APR 物理 内 存 物理 地 址 0 


中- 一 proc.p_addr 
| 一 P 丈 入 | | 执行 进程 的 数据 自 


1_100_000_000_000_000 


图 2-14 通过 变量 u 访问 user 结构 体 


地 址 01400004 的 高 位 3 比特 为 6， 这 意味 着 内 核 模 式 使 用 的 编号 为 6 
的 APR 将 被 选择 。 由 于 低位 的 比特 全 部 为 0， 因 此 u 指向 内 核 空间 第 
6 页 的 起 始 位 置 。 


4 注意 ， 此 处 为 八进制 地 址 。 一 一 译 者 注 


在 之 后 的 说 明 中 ， 统 一 将 内 核 模式 使 用 的 APR 称 为 “内 核 APR”， 将 用 
户 模式 使 用 的 APR 称 为 “用 户 APR”， 将 起 始 编 号 从 0 开始 的 编号 为 n 
的 APR 标注 为 APRn。 此 外 ， 为 了 区 分 内 存 的 块 与 块 设备 的 块 (512 
ee 
XX 域 ” 等 形式 。 


2.4 小结 

。 执行 中 的 程序 以 进程 为 单位 进行 管理 
通过 不 断 切 换 执行 中 的 进程 ， 达 到 并 行 执行 多 个 程序 的 效果 
proc 结构 体 和 user 结构 体 用 来 保存 进程 的 控制 和 状态 信息 
人 


进程 拥有 各 目 独 立 的 虚拟 地 址 空间 

进程 被 分 配 了 代码 段 及 效 据 段 的 两 个 连续 的 物理 内 存 区 域 
数据 段 由 PPDA、 数 据 区 域 、 栈 区 域 3 部 分 组 成 

代码 段 被 映射 到 虚拟 地 址 空间 的 最 低位 地 址 

数据 区 域 被 映射 到 位 于 代码 段 之 后 的 虚拟 地 址 至 间 ， 起 始 地 址 以 
和 


栈 区 域 被 映射 到 虚拟 地 址 空间 的 最 高 位 地 址 。 根 据 需 要 向 虚拟 地 
址 的 低位 方 呵 目 动 扩展 


第 3 章 ”进程 的 管理 I 
3.1 ”进程 的 生命 周期 


进程 典型 的 生命 周期 如 下 所 示 (图 3-1) 。 


生成 子 进程 


Ee CF 
/人 一、 口 1 
切换 执行 进程 
wait exec 


执行 另 一 个 程序 


exit 
取得 子 进 进入 僵尸 状态 
程 的 执行 
结果 并 清 
理子 进程 


图 3-1 进程 的 生命 周期 

1. 某 个 进程 通过 系统 调用 fork ， 创 建 一 个 用 于 执行 程序 的 进程 。 生 成 
此 进程 的 进程 称 为 父 进程 ,被 生成 的 进程 称 为 子 进程 。 子 进程 通过 复制 
父 进 程 的 数据 得 以 创建 。 

2. 父 进程 执行 系统 调用 wait ， 进 入 等 待 状态 直到 子 进 程 处 理 结束 。 


3. 当 控 制 权 转移 到 子 进 程 后 ， 子 进程 通过 系统 调用 exec 将 程序 读 取 到 
内 存 并 开始 执行 。 


4. 当 程 序 执行 完毕 后 ， 子 进程 通过 系统 调用 exit 结束 自身 的 运行 并 进 
入 僵尸 状态 ， 控 制 权 交 回 父 进 程 。 

5. 父 进 程 得 到 子 进程 的 执行 结果 后 清理 子 进程 。 

代码 清单 3-1 征用 C 语言 编写 的 进行 上 述 处 理 的 例子 。C 语言 的 芳 数 
库 提供 了 用 来 包装 系统 调用 的 函数 ， 使 用 户 程序 可 以 像 执行 普通 函数 
那样 访问 系统 调用 。 

代码 清单 3-1 进程 的 生命 周期 


1 orl | 
2 1E(L == 0) 4 | SS 
Je execv (program name, argv); . 
nal > 
二 SS) i 
_6 while(wait() != i); y 


1 执行 fork() 将 生成 一 个 进程 。 父 进程 通过 fork( ) 得 到 子 
进程 的 ID ( 非 0 的 整数 ) 。 

6 ”执行 wait() 后 进入 等 待 状态 直至 子 进程 处 理 结束 。 父 进程 进 
入 休眠 状态 ， (如 果 此 时 不 存在 其 他 执行 优先 级 更 高 的 进程 ， 控 
制 权 将 被 转交 给 子 进程 。 


1 子 进程 人 fork() 内 部 开始 进行 自身 的 处 理 ， 并 从 fork() 
返回 0。 


3 ”在 程序 最 后 ， 执 行 由 编译 器 插入 的 用 以 访问 系统 调用 exit 的 
指令 以 终止 进程 。 


4 ”此 处 加 入 exit() 是 为 了 防止 execv( ) 执行 失败 。 
6 ”控制 权 被 交 回 父 进程 。 通 过 wait() 返回 已 结束 的 子 进 程 的 
ID 。 


3.2 ”创建 进程 


进程 的 复制 


通过 将 父 进程 的 数据 复制 到 子 进程 ,以 此 创建 新 的 进程 。 由 于 可 以 将 此 
过 程 看 做 对 进程 的 分 文 处 理 ， 因 此 创建 进程 的 系统 调用 被 命名 为 fork 


被 复制 的 数据 如 下 所 示 (图 3-2) 。 


创建 进程 的 进程 成 为 
被 创建 进程 的 父 进程 
procl] 指向 数组 text[] 的 同一 元 素 “text 


proc.p_ppidC 


数据 段 代码 段 


已 打开 的 文件 和 当前 目 
录 等 数据 也 被 继承 


图 3-2 进程 的 生成 
。 复制 proc[] 数组 元 素 
o 子 进程 的 proc.p_ppid 指 同 父 进 程 的 proc.p_pid 。 
。 复制 数据 段 
复制 对 象 包括 PPDA。 子 进程 继承 了 已 打开 的 文件 和 当前 目录 
等 数据 。 


二 


O 


oO 


子 进程 的 user .p_procp 指向 proc[] 中 代表 子 进程 的 元 


力 、 


。 代 码 段 不 是 复制 对 象 。 子 进程 与 父 进程 共享 text[] 中 的 相 
同 元 素 。text[] 用 来 管理 代码 段 ， 详 细 请 参考 第 4 章 。 
父 进程 和 子 进程 


创建 进程 的 进程 称 为 父 进程 ,被 其 创建 的 进程 称 为 子 进程 。 将 子 进程 的 
proc,p_ppid 设置 为 父 进程 的 ID 。 反 之 ， 父 进程 若 想 确定 自己 的 子 
进程 ， 必 须 遍 历 proc[] 找到 所 有 proc.p_ppid 指 癌 自己 的 进程 


(图 3-3 ) 
1 个 父 进程 ( proc[0] 除外 ) 对 应 
0 个 以 上 ( 包括 0 个 ) 子 进程 
proc.p_ppid proc.p_ppid 
子 进程 的 proc.p_ppid 指向 父 进程 


proc.p_ppid proc.p_ppid 


若 想 确定 自己 的 子 进程 ， 必 须 遍 
历 procl[] 找到 所 有 proc.p_ppid 指 
向 自己 的 进程 


2 让 4 


3-3” 父 进程 和 子 进 程 
父 进程 和 子 进 程 具有 如 下 特点 。 
。 各 进程 拥有 1 个 父 进 程 和 0 个 以 上 (包括 0 个 ) 的 子 进程 
。 父 进程 在 子 进程 结束 时 ， 取 其 结束 状态 并 释放 子 进程 资源 
进程 继承 了 父 进 程 打 开 的 文件 和 当前 目录 等 数据 


。 子 进程 和 父 进程 共享 代码 段 。 但 是 ， 如 果子 进程 执行 了 其 他 程 
序 ， 这 种 共享 关系 将 被 解除 


。 由 于 子 进程 和 父 进程 各 自 独 立 ， 因 此 他 们 拥有 独立 的 数据 段 ， 
user 结构 体 和 proc[] 数组 元 素 。 在 执行 时 不 会 相互 影响 


UNIX V6 提供 了 使 父 进程 可 以 介入 子 进 程 处 理 的 跟踪 机 制 ， 以 及 用 于 
实现 父 了 进程 问 通 信 的 管 遭 机 抽 。 在 第 6 章 和 第 11 章 将 分 别 对 它们 进 
行 介绍 。 

系统 调用 fork 


创建 新 进程 时 需要 使 用 系统 调用 fork 。 系 统 调用 的 详细 介绍 请 参考 第 5 
章 ， 现 在 只 需要 了 解 通过 内 核 进 程 处 理 系统 调用 即 可 。 

用 C 语言 编写 的 用 户 程序 在 执行 fork( ) 时 会 首先 调用 C 语言 的 库 画 
数 fork() ， 在 此 库 函 数 中 再 通过 执行 sys fork 来 访问 系统 调用 
fork (代码 清单 3-2 ) 


代码 清单 3-2 C 语言 的 库 函 数 fork() (source/s4/fork.s) 


ie Eork Cerror> “parolid 
上 上 要 
oork: 
Wd mov r5,- (sp) A 
WS mov Spr ES ] 
| sys fork | 了 的 
| br 1f x / 

4 4 
JE bec 2 下 1 EA 
9 jmp Cerror < 
原本 3 
时 1 mov roOrapare ud 1 
硬汉 LE r0 4 
El 2 
Ed mov (sp)+,r5 | 
LS ECS pc 
El BSBe 
| 7 te I 三 二 之 


3 UNIX V6 的 C 编译 絮 将 C 语言 的 数 转换 为 起 始 位 置 珊 有 下 
划 线 “ ”的 标签 。 因 此 ， 这 里 的 _fork: 就 相当 于 C 语言 的 
fork() 函数 。 


sys 指令 是 用 来 执行 系统 调用 的 汇编 指令 ， 它 的 参数 是 代表 执行 哪个 
系统 调用 的 整数 。 此 时 ， 控 制 权 由 用 户 进 程 交 给 内 核 进程 ， 内 核 的 
fork( ) 被 执行 ， 使 得 创建 进程 的 处 理 也 开始 执行 (代码 清单 3-3) 。 


系统 调用 fork 针对 父 进 程 和 子 进程 各 退回 1 次 1 。 父 进程 和 子 进 程 的 
处 理 如 下 所 示 。 


1 父 进程 和 子 进程 此 时 共用 一 份 代码 ， 父 进程 从 fork 返回 处 继续 运行 ， 而 子 进程 从 fork 返 
回 处 开始 运行 。 一 一 译 者 注 


代码 清单 3-3 fork() (sys/ken.c) 


ork() 


下 才 


register Struct proc *pi, *p2; 


pi = u.u_procp; 
for(p2 = &proc[0]; p2 < &proc[NPROC]; p2++) 
if(p2->p_stat == NULL) 
goto found; 
Uu.U_error = EAGAIN; 
goto out; 


OOOOORODP 


found: 
if(newproc()) { 
u.u_arQO[RO] = pi->p_pid; 
.U_cstime[0] 0 ; 
0 


.U_cstime[11] 
.U_stime = 0; 


了 


.U_cutime[0] 
.U_cutime[1] 
.U_utime = 0; 
eturn; 


0O: 
0O: 


了 


} 
U.u_arQO[RO] = p2->p_pid,; 


U.u_arQO[R7] =+ 2; 


父 进程 的 处 理 


5 将 pl 指向 执行 进程 〈 父 进程 ) 的 proc 结构 体 。 


6~10 “从 起 始 位 置 遍 历 proc[] 寻找 未 使 用 的 元 素 ， 找 到 后 将 p2 
指向 该 元 素 ， 然 后 跳 转 至 found (图 3-4) 。 


proc[] 


pP_stat，NULL 


图 3-4 寻找 未 使 用 的 roc[ ] 数组 元 素 


13 ”找到 未 使 用 的 元 素 后 ， 调 用 newproc( ) 生成 新 的 进程 。 由 
于 newproc() 向 父 进 程 返回 0 ， 因 此 此 处 if 条 件 的 值 在 父 进程 
上 为 假 。 


23 ”将 父 进程 的 r0 设 为 子 进程 的 proc.p_pid ， 以 此 作为 系统 
调用 fork 对 父 进程 的 返回 值 。 通 过 u,u_arg 可 以 访问 用 户 进程 
的 寄存 器 。 详 细 说 明 请 参考 第 5 章 。 


26 “将 父 进程 的 程序 计数 器 指向 下 一 条 指令 。 
内 核 的 fork() 处 理 到 此 结束 ， 下 面 来 看 一 下 返回 到 C 语言 库 函 数 
fork() 后 的 处 理 (代码 清单 3-2) 。 


用 户 进程 的 程序 计数 器 已 经 被 修改 ， 此 时 指向 前 面 给 出 的 汇编 代码 
fork.s 的 第 8 行 。 


bec 指令 用 来 检查 进 / 借 位 标志 (PSW[0]) 是 否 为 0。 在 系统 调用 处 理 
中 如 果 出 现 错误 ， 此 标志 将 被 置 1。 如 果 此 标志 为 0 则 跳 转 到 第 13 

行 ， 通 过 rts 指令 返回 调用 C 语言 库 函 数 fork( ) 的 位 置 。 返 回 值 为 
保存 在 r0 中 的 子 进 程 的 ID 。 


子 进程 的 处 理 


在 内 核 的 fork() 处 理 中 ， 子 进程 从 newproc( ) 返回 处 开始 执行 
(代码 清单 3-3 ) 。 


13 “newproc( ) 对 子 进程 返回 1 ， 因 此 if 条 件 的 值 在 子 进程 上 
为 真 。 子 进程 从 newproc( ) 返回 处 开始 执行 和 返回 值 为 1 的 原因 
将 在 后 文中 说 明 。 


14~21 ”将 用 户 进程 的 r0 设 定 为 父 进程 的 proc.p_pid， 以 此 作 
为 系统 调用 fork 对 子 进程 的 返回 值 。 在 处 理 结束 前 ， 进 程 的 执 
行 时 间 被 清 0。 


内 核 的 fork() 处 理 到 此 结束 ， 下 面 来 看 一 下 返回 到 C 语言 库 函 数 
fork() 后 的 处 理 (代码 清单 3-2) 。 


在 前 面 给 出 的 汇编 代码 fork.s 里 ，sys fork 处 理 结束 后 将 继续 执 
行 第 7 行 的 br 1f 。br 是 无 条 件 分支 转移) 指令，1f 表示 跳 转 到 
下 一 条 标签 所 在 的 位 置 。 第 11 行 的 mov 指令 将 父 进程 的 
proc.p_pid 复制 到 _par_uid 中 ， 然 后 将 r0 清 0。 调 用 C 语言 库 函 
数 fork( ) 的 用 户 程序 可 以 通过 _par_uid 取得 父 进程 的 ID。 第 15 
行 的 rts 指令 用 来 返回 调用 C 语言 库 函 数 fork( ) 的 位 置 ， 返 回 值 为 
保存 在 r0 中 的 0 。 


newproc() 


newproc( ) 是 实际 创建 进程 的 函数 (代码 清单 3-4 ) 。 它 负责 将 
proc[] 中 代表 执行 进程 的 元 素 和 执行 进程 的 数据 段 复 制 到 子 进程 中 。 


代码 段 不 属于 复制 对 象 ， 子 进程 和 执行 进程 共享 相同 的 代码 段 。 
代码 清单 3-4 newproc() (ken/slp.o) 


ewproc() 


yd 


int alil, a2; 

struct proc *p, *up; 
register struct proc *rpp; 
register *rip, n; 


7 


8 p = NULL; 
9 retry: 
10 /* 生成 ID */ 
11 mpid++; 
12 if(mpid < 0) { 
13 mpid = 0; 
14 goto retry; 
15 } 
16 /* 在 proc[] 中 寻找 未 使 用 的 元 素 */ 
17 for(rpp = &proc[0]; rpp < &proc[NPROC]; rpp++) { 
18 if(rpp->p_stat == NULL && p==NULL) 
19 prpp; 
20 if (rpp->p_pid==mpid) 
21 goto retry; 
22 } 
23 if ((rpp = p)==NULL) 
24 panic("no procs"); 
25 
26 /* 生成 proc[] 元 素 */ 
27 rip = u.u_procp; 
28 up = rip; 
29 rpp->p_stat = SRUN; 
30 rpp->p_flag = SLOAD; 
31 rpp->p_uid = rip->p_uid; 
32 rpp->p_ttyp = rip->p_ttyp; 
33 rpp->p_nice = rip->p_nice; 
34 rpp->p_textp = rip->p_textp; 
35 rpp->p_pid = mpid; 
36 rpp->p_ppid = rip->p_pid; 
37 rpp->p_time = 0; 
38 
39 /* 将 参照 计数 器 加 1 */ 
40 for(rip = &u.u_ofile[0]; rip < &u.u_ofile[NOFILE];) 
41 if((rpp = *rip++) != NULL) 
42 rpp->f_count++; 
43 if((rpp=up->p_textp) != NULL) { 
44 rpp->x_count++; 
45 rpp->x_ccount++; 
46 } 
47 U.U_cdir->i count++; 
48 
49 /* 复制 数据 段 */ 
50 savu(u.u_rsav); 
51 rpp = p; 
52 u.u_procp = rpp; 
53 rip = up; 
54 n = rip->p_size; 
55 al = rip->p_addr; 
56 rpp->p_size = n; 
57 a2 = malloc(coremap, nN); 


58 if(a2 == NULL) { 


59 rip->p_stat = SIDL 
60 rpp->p_addr = al 

61 savu(u.u_ssav); 

62 xswap(rpp, ©0, 0); 

63 rpp->p_flag =| SSWwAP; 
64 rip->p_stat = SRUN; 
65 } else { 

66 rpp->p_addr = a2; 

67 while(n--) 

68 copyseg(alil++, a2++); 
69 } 

70 u.u_procp = rip; 

71 return(0); 

72 } 


11~15 mpid 是 用 来 向 进程 分 配 ID 的 全 局 变量 (代码 清单 3- 
5) 。 


代码 清单 3-5 mpid (system.h) 


1 int mpid; 


每 次 创建 一 个 新 的 进程 ，mpid 就 会 随 之 加 1。 这 个 mpid 是 分 配给 子 
进程 的 ID 。 


mpid 是 int 型 的 变量 ， 随 着 值 的 不 断 增加 ， 最 高 位 的 符号 位 最 终 会 
被 置 1， 导 致 出 现 负 数 。 这 时 mpid 会 重 置 为 0 并 再 次 党 试 加 1。 当 时 
的 C 语言 还 不 存在 unsigned 型 的 定义 。 


17~24 ”从 起 始 位 置 遍历 proc[] 寻找 未 使 用 的 元 素 。 如 果 不 存在 
这 样 的 元 素 说 明 proc[] 的 空间 已 被 用 尽 ， 此 时 调用 panic( ) 售 
止 系统 运行 。 


与 此 同时 ， 检 查 proc[] 的 各 个 元 素 的 成 员 变 量 proc.p_pid ， 
确认 是 否 存 在 某 个 进程 ， 其 ID 与 即将 分 配 的 ID 相同 。 如 果 存 在 


这 样 的 进程 则 再 次 生成 ID。 


27~28 “开始 对 子 进程 进行 初始 设 定 。 从 u.u_procp 取得 
proc[] 中 代表 执行 进程 〈 父 进程 ) 的 元 素 。 


29~37 rpp 中 存放 了 proc[] 中 未 被 使 用 的 元 素 。 此 处 对 rpp 
进行 下 述 设 定 。 

。 可 执行 状态 (将 proc,p_stat 设 定 为 SRUN ) 

。 位 于 内 存 中 (设置 SLOAD 标志 位 ) 

。 分 配 ID (将 proc.p_pid 设 定 为 mpid ) 

。 执 行 时 间 为 0 (将 proc.p_time 设 定 为 0) 


。 父 进程 为 执行 进程 (将 proc.p_ppid 设 定 为 执行 进程 的 
proc.p_pid) 


此 外 ,proc.p_uid 、proc.p_ttyp、proc.p_nice 和 
proc.p_textp 继承 了 父 进程 相应 的 数据 。 


40~42 ”由 于 子 进 程 继承 了 由 父 进 程 打开 的 文件 ， 因 此 这 
参照 计数 器 都 加 1。 关 于 已 打开 文件 的 参照 计数 器 ， 请 参 


草 


43~46 ”因为 子 进程 与 父 进 程 指向 text[] 中 相同 的 元 素 ， 所 以 此 
元 素 的 参照 计数 器 加 上 1。 关 于 text .x_count 和 
text .x_ccount 的 不 同 详 见 第 4 章 。 


47 ”由 于 子 进 程 继 承 了 当前 目录 的 数据 ， 因 此 inode[] 中 对 应 
此 目录 的 元 素 的 参照 计数 器 加 上 1。 关 于 ijnode[] 数组 元 素 的 说 


明 请 参见 第 9 章 。 


50 ”调用 savu() ， 将 r5、r6 的 当前 值 暂 存 至 user,u_rsav 。 
savu( ) 会 在 下 一 节 中 介绍 。 


些 文件 的 
见 第 10 


51~53 ”暂时 将 父 进程 的 user .u_procp 指向 proc[] 中 代表 子 
进程 的 元 素 。 此 时 复制 出 来 的 父 进程 数据 段 ， 其 user .u_procp 
将 指向 proc[] 中 代表 子 进 程 的 元 素 ， 这 样 等 于 为 子 进程 构造 了 
一 份 与 父 进程 完全 相同 但 却 属 于 子 进 程 自 身 的 数据 段 。 至 于 父 进 
程 本 身 ， 我 们 在 rip 中 暂 存 了 proc[] 中 代表 父 进程 的 元 素 ， 用 
于 在 第 70 行 恢复 它 的 user.u_procp 。 


54~56 ”将 子 进程 数据 段 的 长 度 设 置 为 父 进程 数据 段 的 长 度 。al 
中 保存 了 父 进程 数据 段 的 物理 地 址 。 


57 ”调用 malloc( ) 尝试 分 配 的 一 块 与 父 进 程 的 数据 段 相同 长 度 
的 内 存 。malloc( ) 是 用 来 分 配 内 存 或 交换 空间 的 函数 ， 如 果 执 
行 成 功 则 返回 被 分 配 区 域 的 物理 地 址 ， 如 果 失 败 则 返回 NULL 。 
本 章 的 最 后 将 具体 说 明 此 函数 。 


根据 malloc( ) 执行 的 成 功 与 否 ， 接 下 来 的 处 理会 有 所 不 同 。 如 
条 内 存 4 分 配 成 功 ， 数据 段 将 被 复制 到 此 区 域 。 如 果 内 存 没有 足够 
的 空间 ， 父 进程 的 数据 段 会 被 复制 到 交换 空间 (作为 子 进 程 的 数 
据 段 ) ， 待 数据 从 交换 空间 换 入 内 存 时 再 对 其 分 配 内 存 (图 3- 


5) 


malloc() 执 行 失败 


父 进 程 的 ' 


proc.p_addr 通过 xswapl() 
复制 
父 进程 的 数据 段 子 进程 的 数据 段 


malloc() 执 行 成 功 


通过 malloc() 取 得 一 
的 区 域 的 地 址 
子 进程 的 数据 段 


保留 内 存 中 数据 的 同时 ， 向 
交换 空间 换 出 数据 ( 由 内 存 
向 交换 空间 复制 ) 


图 3-5 数据 段 的 复制 
58 ”以 下 是 malloc() 执行 失败 时 的 处 理 。 


59 “将 父 进程 的 状态 设置 为 SIDL 。 处 于 SIDL 状态 的 进程 不 会 
被 选中 成 为 执行 进程 ， 也 不 会 被 换 出 至 交换 空间 。 执 行 第 62 行 的 
xswap( ) 时 ， 复 制 父 进程 的 数据 段 到 交换 空间 的 处 理 被 启动。 在 
此 处 理 过 程 中 ， 父 进程 将 暂时 进入 休 眼 状态 。 将 其 设置 成 SIDL 
状态 是 为 了 防止 在 复制 处 理 中 父 进程 成 为 执行 进程 ， 或 其 内 存 数 
据 被 换 出 导致 数据 发 生变 化 。 


60 ”将 子 进程 的 数据 段 地 址 设 为 与 父 进程 的 数据 段 地 址 相同 。 
61 执行 savu(u.u_ssav)， 将 r5、r6 的 当前 值 暂 存 至 


uU.U_ssav。 因 为 数据 段 包含 user 结构 体 ， 所 以 u,uU_ssav 也 
将 被 复制 到 子 进程 。 


62 ”执行 xswap( ) 将 数据 从 内 存 换 到 交换 区 。 由 于 将 rpp 的 
p_addr 设置 为 父 进程 的 数据 段 地 址 ， 因 此 父 进程 的 数据 段 成 为 处 
理 对 象 。 由 于 xswap( ) 的 第 二 个 参数 为 0， 因 此 内 存 中 的 数据 段 
:会 被 释放 ， 数 据 段 将 从 内 存 复制 到 交换 空间 中 去 。 


63 ”将 子 进程 的 SSWAP 标志 位 置 1。 


64 ”从 内 存 问 交换 空间 的 复制 处 理 结束 后 ， 将 父 进程 恢复 为 
SRUN 状态 。 


65 ”以 下 是 malloc( ) 执行 成 功 时 的 处 理 。 


66~68 ”将 子 进 程 的 数据 段 地 址 设置 为 通过 malloc( ) 取得 的 内 
存 区 域 的 物理 地 址 。 然 后 从 父 进 程 喇 子 进程 复制 数据 段 。 


70~71 ”将 父 进程 的 user .uu_procp 恢复 原状 后 返回 0°。 在 前 面 
nl ) 的 说 明 中 也 提 到 过 这 一 点 , 即 newproc( ) 对 父 进 程 的 
0。 


panic() 


panic() 通过 对 ijdle( ) 进行 循环 调用 以 阻止 程序 继续 执行 ( 表 3- 
1、 代 码 清单 3-6 ) 。 此 郴 数 将 在 由 于 资源 匮乏 等 原因 导致 内 核 处 理 无 
法 继续 进行 的 情况 下 被 执行 。idle( ) 内 部 将 处 理 器 优先 级 设置 为 02 
， 然 后 执行 汇编 指令 wait 进入 等 待 中 断 的 状态 (代码 清单 3-7) 。 


2 0， 使 得 当前 进程 可 以 响应 所 有 优先 级 的 中 断 。 关 于 中 断 优先 级 请 参 
5 章 。 一 一 审 校 者 注 


表 3-1 panic0 的 参数 


代码 清单 3-6 panic() (ken/prf.c) 


1 panic(s) 
char *s,; 
{ ; 
panicstr = s,; 
update( ); 
printf("panic: %s\n", s); 
for(;;) 
idle( ); 


om”~OO 上 wm 


代码 清单 3-7 idle0 (m40.s) 


1 .globl _idle 

2 _idle: 

3 mov PS, - (sp) 
4 bic $340, PS 

5 wait 

6 movV (sp)+,PS 
7 rts pc 


3.3 ”切换 执行 进程 
中 断 执行 进程 


执行 进程 在 执行 内 核 范 数 sleep( ) 后 进入 休 眼 状态 并 中 断 当 前 处 理 。 
此 后 ,由 于 swtch( ) 被 调用 ,执行 进程 发 生 切换 〈 图 3-6) 。 


进程 1 进程 2 时 间 


sleep!) SWtch() 


E 执行 中 的 进程 


图 3-6 sleep() 和 swtch0) 

内 核 画 数 sleep0 一 般 在 下 述 情 况 下 被 调用 。 
用 户 程序 访问 了 系统 调用 wait 

等 待 周边 设备 处 理 完 毕 

等 待 使 用 中 的 资源 被 释放 


只 有 处 于 可 执行 状态 的 进程 才 有 机 会 成 为 执行 进程 。 处 于 休眠 状态 的 
进程 除非 该 状态 被 解除 ， 否 则 无 法 再 次 被 执行 。 


进程 的 执行 状态 


进程 的 状态 由 proc.p_stat 表示 。SRUN 表示 可 执行 状态 ，SSLEEP 
和 SWAIT 表示 休眠 状态 。 


sleep() 将 执行 中 的 进程 设置 为 SSLEEP 或 SWAIT 状态 。wakeup() 
将 对 象 进程 设置 为 SRUN 状态 ( 表 3-2、 图 3-7 ) 。 在 之 后 的 说 明 中 会 
将 进入 休眠 状态 的 过 程 用 “入 睡 * 来 表示 ， 将 从 休眠 状态 恢复 至 执行 状 
态 的 过 程 用 “被 唤醒 ?来 表示 。 


表 3-2 进程 的 执行 状态 


可 执行 状态 wakeup() 


休眠 状态 。SSLEEP 和 SWAIT 的 区 于 被 唤醒 后 
行 优先 级 


可 执行 状态 休眠 状态 


图 3-7 状态 迁移 图 
选择 执行 进程 的 算法 


swtch( ) 用 来 选择 下 一 个 将 被 执行 的 进程 。 它 从 起 始 位 置 遍 历 
proc[] ， 并 将 满足 下 列 条 件 * 的 进程 选择 为 执行 进程 。 


3 此 处 漏 了 一 个 条 件 : 进程 图 像 在 内 存 中 。 对 于 进程 图 像 不 在 内 存 中 的 进程 ， 不 能 被 
swtch( ) 选择 为 执行 进程 ， Da 1 0# 进程 sched( ) 调度 进程 图 像 到 内 存 后 才能 被 
swtch( ) 选择 。 请 参看 第 4 章 审 校 者 注 


。 处 于 可 执行 状态 (SRUN) 


。 拥 有 最 高 的 执行 优先 级 proc.p_pri 的 值 最 小 ) 


将 某 个 进程 明确 指定 为 执行 进程 是 无 法 做 到 的 。 比 如 ， 在 癌 子 进程 转 
移 控制 权 的 时 候 经 常会 利用 系统 调用 wait ， 但 是 如 采 此 时 存在 执行 
优先 级 更 高 的 进程 ， 该 进程 将 被 优先 执行 。 


setpri( ) 函数 用 来 随时 调整 各 进程 的 执行 优先 级 。 占 用 CPU 时 间 越 
长 的 进程 ， 其 执行 优先 级 将 会 逐渐 降低 。 由 于 执行 优先 级 决定 了 被 选 
择 的 进程 ， 因 此 ， 可 以 说 setpri() 中 执行 优先 级 的 计算 方法 对 执行 
进程 的 选择 具有 决定 性 意义 。 
setpri() 在 下 述 处 理 中 将 被 执行 。 
。 时 钟 处 理 (参见 
。 信号 处 理 (参见 
上 下 文 切换 
执行 进程 被 中 断 时 ， 将 当前 执行 状态 保存 于 user 结构 体 中 。 当 被 中 
晰 的 进程 再 次 执行 时 ， 通 过 user 结构 体 恢复 以 前 的 执行 状态 。 这 个 
处 理 被 称 作 上 下 文 切换 。 
上 下 文 切换 处 理 主要 通过 以 下 由 汇编 语言 编写 的 函数 来 完成 ， 即 
savu() 、retu() 、aretu()“。 癌 user 结构 体 保存 数据 的 处 理由 
savu( ) 完成 ， 从 user 结构 体 恢复 数据 的 处 理由 retu( ) 和 


aretu() 完成 。 


系统 调用 wait 


用 户 程序 执行 系统 调用 wait 后 ， 该 进程 的 执行 将 被 中 断 ， 控 制 权 转 
交 给 其 他 进程 。 


wait 具有 以 下 两 个 功能 。 中 断 当 前 进程 等 待 子 进程 执行 结束 ， 以 及 清 
理 执行 结束 的 子 进 程 。 在 3.5 节 中 详细 介绍 wait 。 


No 


第 5 章 
第 6 章 


Wo 


6 


sleep() 


sleep() 首先 将 执行 中 的 进程 设置 为 休眠 状态 (SSLEEP 、SWAIT ) 
( 表 3-4、 代 码 清单 3-8 ) ， 然 后 调用 swtch( ) 切换 执行 进程 。 


sleep( ) 接受 两 个 参数 : chan 和 pri 。chan 为 任意 变量 的 地 址 ， 
其 值 将 被 赋 给 执行 进程 的 proc.p_wchan 。wchan 代表 waiting 
channel， 表 示 此 进程 正在 等 待 proc .p_wchan 所 指向 的 资源 。 


wakeup( ) 将 进程 从 休 眼 状态 唤醒 至 可 执行 状态 。 与 sleep( ) 相同 ， 
它 也 接受 任意 变量 地 址 为 参数 ， 然 后 依次 检查 各 进程 的 
proc.p_wchan ， 并 将 参数 一 致 的 进程 设置 为 可 执行 状态 (SRUN 

) 。 系 统 利 用 sleep() 和 wakeup() 实现 多 个 进程 等 待 同一 资源 时 
的 同步 处 理 (图 3-8 ) 


2 时 间 ] 


资源 (&A)  __-- 
ee 
' 入、 释放 sleep(&A) 
' SSLEER 
a 
| wakeup(&A) SRUN 
! 
| 
I 
1 


L 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


图 3-8 sleep0 和 wakeup0 


pri 表示 执行 优先 级 ， 将 被 赋 给 执行 进程 的 proc.p_pri。 这 个 值 代 
表 进程 被 唤醒 时 的 执行 优先 级 。 


当 pri 的 值 大 于 等 于 0 时， 在 执行 进程 发 生 切换 之 前 ， 以 及 该 进程 再 


次 被 选择 为 执行 进程 之 后 将 对 信号 (参见 第 6 章 ) 进行 处 理 ， 小 于 0 
时 则 忽略 信号 对 其 不 作 处 理 。 此 外 ， 当 pri 的 值 大 于 等 于 0 时 ， 进 程 
将 被 设置 为 SWAIT 状态 ， 小 于 0 时 将 被 设置 为 SSLEEP 状态 ( 表 3-3 
) 。 这 两 种 不 同 的 状态 会 对 在 第 4 章 中 说 明 的 调度 处 理 产 生 影 响 。 


waiting_channel。 所 等 得 资源 的 地 址 


执行 优先 级 


代码 清单 3-8 sleep() (ken/slp.c) 


leep(chan, pri) 


S 
register *rp, s; 


s = PS->integ; 
rp = u.u_procp; 


if(pri >= 0) { 
if(issig()) 
goto psig; 


OOONOOORRODNDP 


[| 


11 sp16(); 


12 rp->p_wchan = chan; 
13 rp->p_stat = SWAIT,; 
14 rp->p_pri = pri; 

15 sp10(); 

16 if(runin != 0) { 

17 runin = 0; 

18 wakeup(&runin); 
19 

20 swtch( ); 

21 if(issig()) 

22 goto psig; 

23 } else { 

24 sp16(); 

25 rp->p_wchan = chan; 
26 rp->p_stat = SSLEEP; 
27 rp->p_pri = pri; 

28 sp10(); 

29 swtch( ); 

30 } 

31 

32 PS->integ = s; 

33 return; 

34 psig 

35 aretu(u.u_qsav); 

36 } 


5 ”你 存 PSW 的 当前 值 ， 为 进程 的 下 次 执行 做 准备 。PS 指 癌 
PSW 所 映 冉 的 地 址 (代码 清单 3-9) 。 


代码 清单 3-9 PS(param.h) 


1 #define PS 0177776 


6 将 rp 设置 为 proc[] 中 代表 执行 进程 的 元 素 。 
8~22 ”如果 执行 优先 级 大 于 等 于 0， 在 入 睡 和 被 唤醒 时 对 信和 号 进 


行 处 理 。 育 先 使 用 issig() 判断 是 否 收 到 信号 ， 如 采 收 到 了 信和 号 


则 跳 转 到 psig 对 其 进行 处 理 。aretu(u,.u_qsav) 的 含义 在 第 
6 章 进 行 说 明 。 


设 定 执行 进程 的 proc,p_wchan 、proc.p_stat 和 
proc,p_pri。 由 于 在 发 生 中 断 时 被 调用 的 wakeup( ) 中 也 有 可 
能 修改 这 些 数 据 ， 此 处 将 处 理 器 优先 级 提升 到 6 以 防止 中 断 的 发 
生 。 关 于 处 理 需 优先 级 和 中 断 请 参见 第 5 章 的 说 明 。 设 定 结束 后 
再 将 处 理 器 优先 级 重 置 为 0。 如 果 标 识 变量 runin 为 1 (表示 不 
存在 需要 被 换 出 至 交换 空间 的 对 象 ) ， 则 启动 进程 调度 器 。 关 于 
标识 变量 runin 和 进程 调度 器 请 参见 第 4 章 的 说 明 。 最 后 调用 
swtch( ) 切换 执行 进程 。 


23~30 ”此 处 为 执行 优先 级 小 于 0 时 的 处 理 。 在 进行 与 11~15 行 相 
同 的 处 理 后 (但 是 状态 变 为 SSLEEP ) ， 调 用 swtch( ) 切换 执行 
进程 。 


32~33 ”为 了 再 次 执行 被 中 断 的 进程 ， 恢 复 在 第 5 行 被 保存 的 
PS9W。 


swtch() 


swtch( ) 是 用 来 切换 执行 进程 的 函数 代码 清单 3-10 ) 。 它 通过 遍历 
os [] ， 选 择 处 于 可 执行 状态 ,并 且 执行 优先 级 最 高 的 进程 作为 新 的 
行进 程 。 


内 核 中 有 很 多 处 理 都 是 从 起 始 位 置 志 历 proc[] ， 而 swtch() 是 从 代 
表 当 前 执行 进程 的 元 素 位 置 开始 遍历 proc[] 。 如 果 存 在 2 个 以 上 具 
有 最 高 执行 优先 级 的 进程 ， 位 于 对 应 执行 进程 的 元 素 后 方 ， 并 且 离 它 
最 近 的 那个 元 素 (进程 ) 将 被 优先 选择 (图 3-9) 。 


procl] 


图 3-9 ”以 执行 进程 为 起 点 循环 一 周 
选择 进程 后 ， 进 行 下 述 处 理 以 切换 执行 进程 。 


。 修改 内 核 APR， 使 得 被 选择 进程 的 user 结构 体 可 以 通过 u 进行 
访问 


。 恢复 在 被 选择 进程 的 user 结构 体 中 保存 的 r5、r6 的 值 

。 恢复 在 被 选择 进程 的 user 结构 体 中 保存 的 用 户 APR 的 值 
swtch( ) 执行 结束 后 ， 被 选择 的 进程 将 返回 到 调用 savu( ) 以 保存 
r5、r6 的 画 数 自身 被 调用 的 位 置 4 ， 前 面 提 到 的 “利用 fork( ) 生成 的 
进程 从 newproc() 返回 1” 的 原因 也 在 于 此 ?”。 


4 即 返回 到 savu( ) 的 调用 者 的 调用 者 。 译 者 注 


5 此 处 逻辑 有 点 跳跃 ， 加 以 说 明 : 父 进程 由 newproc( ) 生成 子 进程 后 ， 父 进程 通过 
newproc() 的 return 9 直接 返回 ， 则 newproc( ) 的 调用 者 fork( ) 获得 返回 值 0; 而 


这 


司 让 


子 进 程 通 过 swtch( ) 切换 上 台 ，swtch( ) 的 返回 值 为 1 返回 到 ， 'savu( ) 的 调 者 的 调 
者 "， 即 fork() ， 则 fork() 获得 返回 值 1。 审 校 者 注 


代码 清单 3-10 swtch() (ken/slp.o) 


s 
{ 


wtch() 


static struct proc *p; 
register i, n; 
register struct proc *rp; 


if(p == NULL) 
p = &proc[90]; 


savu(Uu.u_rsav); 
retu(proc[0].p_addr); 


13 loop: 


runrun = 0; 
rp = py 
p = NULL; 
n = 128; 
i = NPROC， 
do 区 

rpt+, 


if(rp >= &proc[NPROC]) 
rp = &proc[0]; 


if(rp->p_stat==SRUN && (rp->p_flag&SLOAD)!=9) { 


if(rp->p_pri < n) { 
p= rp， 
n = rp->p_pri,; 


} 
} 
} while(--i); 


if(p == NULL) { 


p= rp, 
idle(); 
goto loop; 
} 
rp = ps 


curpri = n; 


retu(rp->p_addr); 
sureg( ); 


if(rp->p_flag&SSwAP) { 
rp->p_flag =& ~SSWAP; 
aretu(u.u_ssav); 


} 


return(1); 


| 


7~8 pp 是 遍历 proc[] 时 所 使 用 的 static 变量 。 它 保存 着 上 次 
执行 swtch( ) 时 选择 的 进程 〈 执 行进 程 ) 所 指向 的 proc[] 的 元 
素 。 初 次 执行 swtch( ) 时 p 的 值 为 NULL ， 指 向 proc[] 的 起 始 


人 


10 ”执行 savu( ) 将 r5、r6 的 当前 值 保存 于 待 中 断 进程 的 
User ,u_rsav 之 中 。 等 到 该 进程 再 次 执行 时 再 予以 恢复 。 


11 ”执行 retu( ) 切换 至 调度 器 进程 。proc[0] 是 供 调度 器 使 用 
的 系统 进程 ， 在 系统 启动 时 被 创建 。 

14 ”将 标志 变量 runrun 设 定 为 0， 该 标志 变量 表示 与 执行 进程 
相 比 ， 存 在 执行 优先 级 更 高 的 进程 (代码 清单 3-11) 。 因 为 即将 
切换 到 拥有 最 高 执行 优先 级 的 进程 ， 在 此 将 runrun 重 置 为 0。 


代码 清单 3-11 runrun (system.h) 


1 char runrun; 


15~17 ”初始 化 工作 变量 。n 是 用 来 管理 进程 执行 优先 级 最 大 值 的 
局 部 变量 。 因 为 最 低 的 执行 优先 级 (proc.p_pri 具有 最 大 值 ) 
为 127， 在 此 代入 一 个 更 大 的 值 128 作为 初始 值 。 
19~30 “” 明 历 proc[] ， 寻 找 满足 下 述 条 件 的 进程 。 

。 可 执行 状态 (SRUN ) 

。 存在 于 内 存 中 (SLOAD ) 

。 执 行 优先 级 最 高 (proc.p_pri 具有 最 小 值 ) 
如 果 不 存 在 处 于 可 执行 状态 的 进程 ，p 保持 初始 值 NULL 不 变 。 


32~36 ”如 采 不 存在 可 执行 的 进程 ， 将 p 设置 为 与 此 前 的 执行 进程 
相对 应 的 proc[ ] 元 素 。 然 后 调用 idle() ， 等 竺 由 于 发 生 中 断 
而 出 现 的 可 执行 进程 。 


举例 来 说 ， 读 取 块 设备 的 处 理 结束 时 将 引发 中 断 ， 使 得 等 待 该 处 
理 结 束 的 进程 被 唤醒 ， 因 此 出 现 了 处 于 可 执行 状态 的 进程 。 再 比 
如 ， 由 时 钟 引发 的 中 断 导 致 设 定 在 某 个 时 刻 启动 的 进程 被 唤醒 的 
情况 也 是 如 些 。 中 断 处 理 结束 后 ， 从 wait 的 下 一 条 指令 开始 继 
续 执 行 ， 并 从 idle() 返回 swtch() 。 随 后 返回 到 标签 loop 的 
位 置 ， 再 次 党 试 选择 执行 进程 。 

37~38 ”由 于 执行 进程 已 被 决定 ， 将 该 进程 代入 rp ， 并 将 该 进程 
的 执行 优先 级 保存 至 curpri 。curpri 为 全 局 变量 ， 用 于 保存 
当前 被 执行 进程 的 执行 优先 级 (代码 清单 3-12) 。 


代码 清单 3-12 curpri (system.h) 


1 char curpri; 


40~41 ”执行 retu( ) 恢复 被 选择 进程 的 上 5、r6， 并 变更 内 核 
APR 的 值 使 u 指向 user 结构 体 。 接 着 执行 sureg( ) 将 保存 于 
被 选择 进程 的 user 结构 体 中 的 APR 的 值 恢 复 到 硬件 的 用 户 
APR， 以 切换 用 户 空间 。 至 此 执行 进程 的 切换 过 程 结 束 。 


43~46 ”如 果 SSWAP 标志 位 为 1， 将 其 清 0 并 从 User.u_ssav 
中 恢复 15、r6 的 值 。 之 所 以 这 样 做 ， 是 因为 当 由 于 调度 器 以 外 的 
原因 导致 数据 被 换 出 内 存 时 ， 将 SSWAP 标志 位 设置 为 1。 这 意味 
着 首先 将 调用 xswap ( ) 进行 换 出 处 理 ,随后 执行 swtch( ) 切换 执 
行进 程 。 在 swtch() 的 第 10 行 执 行 savu(u.u_rsav) 时 , 因为 
user 结构 体 已 被 换 出 至 交换 空间 ,所 以 此 处 的 savu( ) 将 失去 意 
义 。 因 此 ， 解 决 办 法 是 在 交换 处 理 前 首先 执行 savu(u,u_ssav) 
, 当 再 次 执行 进程 时 再 恢复 user .u_ssav 中 保存 的 有 效 值 。! 


48 ”返回 1°。 返回 位 置 为 执行 savu( ) 的 画 数 (该 画 数 调用 
savu( ) 并 在 user 结构 体 中 保存 r5、r6 的 值 ) 自身 被 调用 的 位 
置 o 
1 这 里 对 savu(u.u ssav) 的 作用 做 进一步 说 明 : 
1. savu(u.u _ ssav) 用 来 保存 寄存 器 5 、r6 的 值 。 之 后 可 以 使 用 aretu( ) 来 恢复 所 保 
存 的 值 ， 并 返回 savu( ) 的 调用 者 的 调用 者 。 
2. swtch( ) 的 第 45 行 调 用 了 aretu( ) ， 考 虑 到 在 swtch( ) 之 前 执行 的 xswap( ) 进行 换 
出 操作 ，aretu() 所 恢复 的 z5、r6 的 值 需要 在 调用 xswap( ) 之 前 通过 savu(u.u _ 
ssav ) 进行 保存 。 
3. 3.2 节 给 出 的 newproc() 的 第 62 行 执 行 了 xswap() ， 并 在 此 之 前 的 第 61 行 执行 了 
savu(u.u _ ssav)。* 但 在 newproc() ap es -> Sleep() -> 进程 下 台 
-> 经 swtch( ) 切换 该 进程 再 次 上 台 的 这 个 过 程 中 ， 由 于 下 述 两 点 原因 不 会 引起 换 出 操作 。 
因此 此 处 的 savu(u,u _ ssav) 其 实 并 不 需要 在 xswap ( ) 之 前 被 执行 。 
a. 当前 进程 是 生成 的 子 进 程 ， 还 没有 置 SSWAP 标志 ， 不 会 被 换 出 
b. 父 进 程 被 置 SIDL 不 能 被 选择 上 台 
4. 在 上 述 第 3 点 中 ， 由 于 swtch( ) 的 第 45 行 调用 了 aretu()， 控 制 权 会 返回 savu() 的 
即 newproc()) 的 调用 者 。 审 校 者 注 


swtch() 的 返回 位 置 
函数 调用 


这 部 分 对 “ swtch( ) 的 返回 位 置 为 执行 savu( ) 的 函数 自身 被 调用 的 
位 轩 ”进行 说 明 。 


在 进入 正题 前 ， 首 先 需 要 对 函数 调用 时 进程 栈 的 行为 有 所 了 解 。 由 于 
使 用 的 编译 器 等 原因 ， 栈 的 行为 会 有 所 不 同 ， 此 处 以 示例 程序 在 UNIX 
V6 上 的 运行 情况 为 基础 进行 说 明 。 

假设 有 如 代码 清单 3-13 所 示 的 示例 程序 。 


代码 清单 3-13 示例 程序 


汗 
开 


callee(a, b) { 
int c, dd; 


return c + d; 


} 


1 
2 
3 
4 d = b; 
5 
6 
7 
8 caller() { 


9 Int e, f, result,; 
e = > 

本 下 下 三 

12 ee = callee(e, f); 

13 return result,; 


在 此 程序 中 caller 机 数 调用 了 callee 函数 。 上 壕 代码 在 UNIX V6 
模拟 器 上 经 过 编译 生成 如 代码 清单 3-14 所 示 的 汇编 代码 。 


代码 清单 3-14 ”经 过 编译 的 示例 程序 


1 .globl _callee 

2 .text 

3 _callee: 

4 ~~callee: 

5 ~a=4 

6 ~b=6 

7 ~c=177770 

8 ~d=177766 

9 jsr r5,csv 
10 sub $4, sp 
11 mov 4(r5),-10(r5) 
12 mov 6(r5),-12(r5) 
13 mov -10(r5),ro 
14 add -12(r5),ro 
15 jbr L1 


16 L1:jmp cret 

17 .globl _caller 
18 .text 

19 _caller: 

20 ~~caller: 

21 ~result=177764 
22 ~e=177770 

23 ~f=177766 


24 jsr r5,csv 

25 sub $6, sp 

26 mov $1, -10(r5) 

27 mov $2, -12(r5) 

28 mov -12(r5), (sp) 
29 mov -10(r5),-(sp) 
30 jsr pc,*$_callee 
31 tst (sp)+ 

32 mov ro, -14(r5) 


33 mov -14(r5),ro 


34 jbr L2 
35 L2:jmp cret 
36 .globl 

37 .data 


caller() 调用 callee( ) 的 位 置 如 代码 清单 3-15 所 示 。 
代码 清单 3-15 ”调用 callee() 的 位 置 
28 mov -12(r5), (sp) 


29 mov -10(r5),-(sp) 
30 jsr pc,*$_callee 


将 传递 给 callee( ) 的 参数 压 入 栈 后 ， 通 过 jsr 指令 跳 转 至 

allec ls jsr 指令 的 第 一 个 参数 被 压 入 栈 。 此 处 被 压 入 栈 的 pc 的 
值 将 成 为 从 callee( ) 返回 的 位 置 。jsr 指令 的 第 二 个 参数 为 pc 的 
新 值 ， 控 制 权 同时 被 移交 给 callee() ( 表 3-5) 。 


表 3-5 控制 权 被 移交 给 callee() 时 栈 的 状态 


> (从 callee() 返回 的 位 置 


eg 
| 


callee( ) 获得 控制 权 后 ， 百 先 执行 csv (代码 清单 3-16 ) 。 
代码 清单 3-16 csv 


9 jsr r5,csv 


csyv 男 数 用 于 向 栈 压 入 r2、r3 和 r4 的 值 ， 采 用 汇编 语言 编写 (代码 清 
ey 


代码 清单 3-17 csv (conf/m40.s) 


r5,r0 
sp,r5s 
r4,- (sp) 


r3,- (sp) 
r2, - (sp) 
pec, (ro) 


执行 csv 后 控制 权 返 回 callee( ) 时 的 栈 状态 如 表 3-6 所 示 。 
表 3-6 执行 csv 后 的 栈 状态 


可 的 位 置 


的 I3 值 


的 4 值 


的 号 值 


栈 中 保存 了 传递 给 函数 的 参数 ， 从 函数 返回 时 的 位 置 ， 以 及 调用 函数 
r2~r3~r4、 I 的 当前 值 。r5 的 最 新 值 则 指 癌 保存 在 栈 中 的 旧 的 r5 


在 ee 内 使 用 的 局 部 变量 也 通过 栈 进 行 。 函数 的 参数 和 局 
部 变量 通过 r5 进行 访问 ( 表 3-7， 代 码 清 单 3- 人 


代码 清单 3-18 通过 r5 访问 函数 的 参数 和 局 部 变量 


4(r5),-10(r5) 
6(r5),-12(r5) 


表 3-7 局 部 变量 


证 La 
-10(r5) 


。 


随后 ，callee( ) 的 内 部 处 理 继续 运行 ， 将 返回 值 存放 于 r0 之 后 执行 
cret (代码 清单 3-19) 。 


代码 清单 3-19 ”callee() 的 返回 位 置 


13 mov -10(r5),ro 
14 add -12(r5),ro 
15 jbr L1 


16 L1:jmp cret 


cret 是 恢复 保存 在 栈 中 的 寄存 器 数据 的 函数 (代码 清单 3-20 ) 。 
代码 清单 3-20 cret (conf/m40.s) 


1 .globl cret 
2 cret: 


r5,ri 

-(r1i),r4 
-(r1i),r3 
-(r1i),r2 


r5,sp 
(sp)+,r5 
pc 


恢复 保存 在 栈 中 的 5、r4、r3、 了 2 的 值 ， 同 时 调整 sp 使 之 指向 调用 画 
数 时 保存 的 pc 的 值 ( 表 3-8) 。 当 rts 指令 的 参数 为 pc 时， 将 跳 转 
到 sp 所 指 癌 的 值 。 


表 3-8 cret 的 rts 指令 执行 前 的 栈 状 态 


的 了 2 值 恢 复 至 了 2 


的 13 值 恢 


的 14 值 恢 复 至 14 


至 此 控制 权 从 callee() 返回 caller() ，caller() 通过 70 访问 
callee( ) 的 返回 值 并 继续 自身 的 运行 。 


此 外 ， 栈 中 保存 的 位 于 sp 所 指 位 置 以 上 的 数据 不 会 被 删除 。 这 些 数据 
通 单 个 会 仆 再 次 倪 用 ， 在 使 用 新 的 局 部 变量 ， 或 发 生 函 数 调用 时 将 被 


履 盖 。 


栈 上 以 函数 调用 为 单位 进行 管理 的 数据 被 称 为 帧 ，r5 指 癌 与 调用 者 画 
数 相 对 应 的 帧 内 的 r5。 通 过 裔 历 r5, 就 可 以 过 历 所 有 作为 调用 者 的 函数 ， 
因此 rs 被 称 为 帧 指针 或 者 环境 指针 (图 3-10) 。 


全 | return address | 
[4、 一 人 一 2 


= 


[参数 | 


图 3-10 帧 指针 

savul() 

根据 如 上 所 述 的 栈 行为 ， 再 看 一 下 执行 savu( ) ( 表 3-10， 代 码 清单 
3-21 ) 时 所 发 生 的 处 理 。 被 中 断 的 进程 执行 savu( ) 将 r5 和 Fr6 的 当前 
值 保存 于 user 结构 体内 。savu( ) 的 参数 为 u.u_rsav[]， 
u.u_ssav[] ，u.u_qsav[] 其 中 之 一 的 地 址 。r5 和 76 的 当前 值 将 
保存 于 该 地 址 。 

savu( ) 获得 控制 权时 的 栈 状态 如 表 3-9 所 示 。 


表 3-9 savu0 获得 控制 权时 的 栈 状 态 


.= 


| 
pc( 从 savu() 返 的 位 置 ) 


乡 数 (u.u_rsav ， u.u_ssav ，u.u_qsav 其 中 之 一 ) 


EF 存 位 置 | 为 U.U_rsav 、U.U_SSav ` U.uyu_ gsav 其 


代码 清单 3-21 savu0 (conf/m40.s) 


$340, PS 
(sp)+,r1 
(sp),ro 

sp, (roO)+ 


r5, (roO)+ 
$340, PS 
(r1) 


2 ”将 处 理 絮 优先 级 设置 为 7， 以 防止 发 生 中 断 。 


3~4 ”将 pc 保存 在 rl 中 (此 处 的 pc 指向 从 savu() 返回 的 位 
置 ) ， 将 参数 保存 在 r0 中 ( 表 3-11) 。 


表 3-11 保存 r5、r6 


| 


2 500 | 


| 


5~6 ”将 15 和 76 的 当前 值 保存 在 作为 参数 收 到 的 数组 u.u_rsav 


、U.U_ssav 或 u.u_qsav 中 
7 ”将 处 理 器 优先 级 恢复 为 0。 
8 将 rl 设置 为 人 savu() 返回 的 位 置 ， 使 用 jmp 指令 跳 转 到 该 


位 置 。 


retu() ~ aretu() 

切换 进程 时 将 执行 retu( ) ( 表 3-13， 代 码 清单 3-22 ) 。retu() 操 
' 将 u 指 同 user 结构 体 ， 随 后 从 u.u_rsav[] 中 恢复 r5 
和 fr6 的 值 。 


retu( ) 的 参数 为 执行 进程 的 proc .p_addr 。user 结构 体位 于 这 个 
地 址 的 起 始 位 置 。retu( ) 获得 控制 权时 的 栈 状 态 如 表 3-12 所 示 。 


表 3-12 ”retu() 获得 控制 权时 的 栈 状 态 


(从 retu() 返回 的 位 置 ) 


参数 (执行 进程 的 proc.p_addr ) 


表 3-13 ”retul 的 参数 


$340, PS 

(sp)+,r1 

(sp),ro 
1f 


$340, PS 
(sp)+,r1 
(sp),KISA6 
$_u ro 


(rO)+, sp 
(roO)+,r5 
$340,PS 
(r1) 


8 ”将 处 理 器 优先 级 设置 为 7， 以 防止 发 生 中 断 。 

9 ”将 返回 位 置 的 地 址 保存 在 rl1 中 。 

10 ”将 参数 proc.p_addr 保存 在 KISA6 中 。KISA6 表示 内 核 
PAR6 的 地 址 (代码 清单 3-23) 。 这 样 就 可 以 通过 u 来 访问 被 选择 
的 进程 的 user 结构 体 了 。 


代码 清单 3-23 KISA6 (conf/m40.s) 


1 KISA6 = 172354 


11 将 user 结构 体 的 头 部 保存 在 r0 中 。 user 结构 体 的 头 部 为 
u_rsayv 的 定义 (代码 清单 3-24) 。 


代码 清单 3-24 ”user 结构 体 的 头 部 


truct user 


1 s 
24 
3 


int u_rsav[2]; 


13~14 ”将 r6 设 置 为 u.u_rsav[0] 的 值 ，r5 设置 为 
u.u_rsav[1] 的 值 ， 以 此 恢复 r5 和 76 的 数据 。 


15 ”将 处 理 器 优先 级 恢复 为 0。 
16 ”使 用 jmp 指令 从 retu() 返回 。 

下 面 来 看 一 下 aretu() 的 定义 ( 表 3-14) 。aretu() 的 参数 为 
uU.u_ssav[] 或 u.u_qsav[] 的 地 址 。 aretu() 从 接收 到 的 参数 中 
获取 r5 和 Fr6 的 值 并 恢复 到 寄存 器 中 。 该 函数 与 retu( ) 的 区 别 在 于 不 
对 APR 进行 操作 ， 因 此 u 指 同 的 user 结构 体 不 会 发 生 切 换 。 


表 3-14 aretu() 的 参数 


u.u_ssav 或 u.u_qsav 的 地 址 。 从 中 获取 r5 和 76 的 值 用 于 恢复 寄存 器 


aretu( ) 获得 控制 权时 的 栈 状 态 如 表 3-15 所 示 。 
表 3-15 aretu() 获得 控制 权时 的 栈 状 态 


参数 (u U_Sssav 或 U.U_qsav 的 地 址 ) 


-十 (从 aretu() 返回 的 位 置 


2 ”将 处 理 器 优先 级 设置 为 7， 以 防止 发 生 中 断 。 
3~4 ”将 返回 地 址 保存 在 r1， 参 数 保存 在 r0 中 。 之 后 的 处 理 与 
retu() 相同 ， 从 u.u_ssav 或 u.u_ dsav 中 获取 r5 和 76 的 值 


至 此 ， 利 用 retu() 或 aretu() 恢复 了 r5 和 Fr6 的 值 ， 执 行 savu() 
时 的 栈 状 态 也 得 以 复原 ( 表 3-16) 。 


表 3-16 retu0)、aretu0) 执行 后 的 栈 状态 


的 路 值 


加 
旧 的 r5 值 


pc (从 调 ] savu() 的 函数 返回 的 位 置 


此 时 执行 cret 指令 ， 将 恢复 栈 内 保存 的 r2~r5 的 值 ， 并 返回 到 
savu( ) 的 调用 者 的 调用 者 。 


如 上 所 述 ， 在 执行 retu() 、aretu( ) 后 再 执行 return (=cret 
) ， 将 从 调用 savu( ) 的 画 数 中 返回 。 


setpri() 

setpri() 用 于 更 新 进程 的 执行 优先 级 (proc.p_pri) ( 表 3-17， 
代码 清单 3-26 ) 。 在 发 生 时 钟 中 断 或 处 理 信 号 时 执行 setpri() ， 定 
期 更 新 执行 优先 级 。setpri( ) 的 参数 为 proc[] 的 元 素 ， 该 元 素 对 
应 更 新 对 象 进程 。 


赋予 proc .,p_pri 的 新 值 为 PUSER+ 
(proc.p_cpu/16)+proc.p_nice ， 但 最 大 值 为 127。 请 注意 ， 
proc.p_pri 的 值 越 小 ,执行 优先 级 越 高 。 

PUSER 的 值 被 定义 为 100 (代码 清单 3-25 ) 。 


代码 清单 3-25 PUSER (param.h) 


1 #define PUSER 100 


| 


proc.p_cpu 为 该 进程 占有 CPU 的 总 时 间 ， 在 进程 运行 过 程 中 会 随 着 
时 钟 中 断 而 递增 。 但 是 ， 当 进程 从 交换 空间 换 入 内 存 时 ， 该 值 被 重 置 
为 0。CPU 的 占有 时 间 越 长 ,进程 的 执行 优先 级 越 低 。 

proc.p_nice 在 用 户 执行 系统 调用 nice 时 被 设 定 ， 且 总 为 正 值 。 该 
值 用 来 调 低 执行 优先 级 。 但 也 有 例外 ， 超 级 用 户 (参考 第 9 章 ) 可 以 
将 其 设 为 负 值 。 


表 3-17 setpri( 的 参数 


etpri(up) 


s 
{ 


register *pp, p; 


pp = UP， 
p = (pp->p_cpu & 0377)/16; 
p =+ PUSER + pp->p_nice,; 
if(p > 127) 

p = 127; 
if(p > curpri) 

runrun+t+; 
pp->p_pri = p; 


6~9 ”计算 执行 优先 级 。 


10~11 curpri 为 当前 执行 中 的 进程 的 执行 优先 级 。 标 志 变 量 
runrun 表示 存在 执行 优先 级 大 于 当前 进程 的 其 他 进程 。 因 为 
proc.p_pri 的 值 越 小 执行 优先 级 越 高 ,所 以 此 处 的 不 等 号 实际 上 
是 错误 的 ， 这 个 错误 在 UNIX 的 下 一 个 版 本 中 已 被 修正 。 


wakeup() 


wakeup( ) 遇 历 proc[] 的 元 素 ， 唤 醒 因 为 等 竺 由 该 范 数 的 参数 所 指 
定 的 资源 而 处 于 休眠 状态 的 进程 ( 表 3-18， 代 码 清单 3-27 ) 。 


表 3-18 ”wakeup0 的 参数 


原 的 地 址 


akeup(chan ) 


register Struct proc *p; 
register C， 工 ; 


C chan; 
p = &proc[0] 
NPROC; 


i 
do { 


if(p->p_wchan == c) { 
setrun(p); 


p++, 
} while(--i); 


6~14 ”从 起 始 位 置 遍 历 proc[] ， 对 于 与 proc,p_wchan 参数 
值 相同 的 进程 ， 可 执行 setrun( ) 将 其 设 定 为 可 执行 状态 。 


setrun() 


setrun( ) 将 由 参数 指定 的 进程 设 定 为 可 执行 状态 (SRUN )”( 表 3- 
19， 代 码 清单 3-28 ) 。 


表 3-19 setrun0 的 参数 


设 定 对 象 进程 的 proc 结构 体 


代码 清单 3-28 setrun() (kenm/slp.c) 


setrun(p) 

{ 
register struct proc *rp; 
rp = Pp; 
rp->p_wchan = 0; 
rp->p_stat = SRUN; 
if(rp->p_pri < curpri) 


runrunt+; 

if(runout != © && (rp->p flag&SLOAD) == 0) { 
runout = 0; 
wakeup(&runout); 


6 ”由 于 已 从 体 眼 状态 被 唤醒 ， 因 此 将 proc.p_wchan 重 置 为 
0 O 


7 将 proc.p_stat 置 为 SRUN 使 进程 成 为 可 执行 状态 。 


8~9 ”如 果 比 执行 进程 的 执行 优先 级 高 ， 则 设置 标志 变量 runrun 
。 被 唤醒 的 进程 的 执行 优先 级 由 使 之 入 睡 的 Sleep() 设 定 。 


10~13 ”标志 变量 runout 表示 当前 不 存在 可 由 交换 空间 换 入 内 存 
的 进程 。 如 果 已 经 设置 了 runout ， 而 被 唤醒 的 进程 已 位 于 交换 
空间 ， 则 说 明 可 能 允许 将 其 他 进程 换 入 内 存 ， 因 此 ， 此 处 将 标志 
变量 runout 重 置 为 0， 并 启动 调度 器 。 关 于 调度 器 的 详细 介绍 请 
见 第 4 章 。 


3.4 ”执行 程序 


执行 程序 时 ， 首 先 需 要 将 该 程序 的 执行 文件 从 块 设备 读 取 至 内 存 ， 并 
将 其 配置 到 执行 进程 的 虚拟 地 址 空间 中 。 


系统 调用 exec 用 于 执行 程序 执行 文件 的 读 入 处 理 和 分 配 内 存 的 处 
理 。 

系统 调用 exec 不 会 改变 已 打开 文件 和 当前 目录 的 数据 。 父 进程 的 数 
据 按 原状 保留 。 


程序 执行 文件 的 格式 


系统 调用 exec 的 重要 处 理 之 一 是 读 取 程序 的 执行 文件 。 本 节 将 介绍 
UNIX V6 程序 执行 文件 (a.out) 的 格式 。 


程序 执行 文件 从 文件 头 开 始 依次 由 下 述 部 分 构成 。 符 号 表 (symbol 
table) 和 重 定位 比特 (relocation bit) 在 本 书 中 不 做 介绍 。 


人 

。 代码 (程序 的 指令 ) 

。 数据 (初始 值 不 为 0 的 全 局 变量 等 ) 
。 符号 表 〈 供 调试 器 等 使 用 ) 

。 重 定 位 比特 


0 固定 的 16 字 玉 ， 从 起 始 位 置 开始 依次 由 表 3-20 所 示 数 


表 3-20 程序 执行 文件 的 文件 头 
中 ER 


条 


| 


魔术 数字 为 0407 的 程序 在 存在 多 个 进程 时 不 共享 代码 段 。 程 序 执 行文 
件 的 代码 和 数据 一 起 读 取 至 进程 的 数据 区 域 (图 3-11) 。 


块 设备 虚拟 地 址 空间 


USer.u_dsize 


数据 段 


USer.uUL ssize 
Oxffff 


参数 压 入 栈 


图 3-11 魔术 数字 0407 


魔术 数字 为 0410 的 程序 在 存在 多 个 进程 时 共享 代码 段 。 程 序 执行 文件 
的 代码 部 分 读 取 到 进程 的 代码 段 中 ， 数 据 部 分 读 取 到 进程 的 数据 区 
域 。 读 取 的 数据 部 分 位 于 代码 段 之 后 ， 起 始 地 址 以 8KB 为 边界 对 齐 。 
8KB 恰好 等 于 APR1 页 的 长 度 。 代 码 段 和 数据 区 域 分 别 对 应 不 同 的 
APR， 因 此 在 虚拟 地 址 空间 里 ， 数 据 区 域 的 起 始 地 址 也 需要 以 8KB 为 
边界 对 齐 (图 3-12 ) 


块 设备 虚拟 地 址 空间 


0 a.out 0 ”代码 自 
020 User.u_tsize 
0 mod 8K 0 mod 8K 


User.u_dsize 


数据 段 


图 3-12 ”魔术 数字 0410 


魔术 数字 为 0411 的 程序 在 PDP-11/40 的 环境 中 未 投入 使 用 ， 因 此 本 书 
中 也 直接 省 略 。 


bss 代表 初始 值 为 0 的 数据 。 因 为 已 知 初始 值 为 0， 程序 执行 文件 中 并 
a 
J 空间 。 


用 户 程序 可 以 使 用 C 函数 库 的 malloc( ) 画 数 来 扩展 数据 区 域 。 

栈 区 域 位 于 数据 段 ， 被 赋予 地 址 空间 的 最 高 位 地 址 。 执 行 系统 调用 
exec 时 将 生成 长 度 为 20x64 字 世 的 栈 区 域 。 栈 区 域 根据 实际 情况 自动 
扩展 。 关 于 栈 区 域 的 扩展 将 在 第 5 章 中 介绍 。 栈 区 域 也 用 于 保存 传 给 
程序 的 参数 。 

系统 调用 exec 


系统 调用 exec 进行 的 处 理 不 仅 与 进程 管理 相关 ， 还 与 文件 系统 、 块 
设备 IO 等 多 种 要 素 关 系 。 若 想 完 全 理解 这 一 概念 ， 必 须 了 解 UNIX 


V6 内 核 整体 。 建 议 在 阅读 本 书后 复习 相关 内 容 。 

用 户 程序 调用 exec 后 将 执行 下 述 处 理 。 

。 将 传递 给 执行 程序 的 参数 存 入 缓冲 区 

。 将 程序 从 块 设 备 读 取 到 内 存 

。 更 新 进程 的 虚拟 地 址 空间 

。 将 存 入 缓冲 区 的 参数 压 入 栈 

。 对 SUID、SGID (参见 第 9 章 ) 进行 处 理 

。 对 寄存 器 和 信号 进行 初始 化 
exec 的 第 1 个 参数 为 一 个 字符 串 的 起 始 地 址 ， 该 字符 串 代表 程序 执行 
文件 路 径 ， 以 0 (NULL ) 结尾 。 第 2 个 参数 为 传递 给 程序 的 参数 序列 
的 起 始 地 址 。 参 数 序 列 中 各 参数 的 起 始 地 址 依次 排列 ， 以 0 结尾。 各 
个 参数 的 值 也 同样 以 0 结尾 。 执 行 exec 汇编 代码 的 例子 如 代码 清单 
3-29 所 示 。 
代码 清单 3-29 ”执行 系统 调用 exec 


1 sys exec; name; args 


3 name: ...\0 


5 args: arg0; arg1; ...; \0 


6 arg0: ...\0 
7 arg1: ...\0 


在 更 新 进程 的 虚拟 地 址 空间 之 后 ， 传 递 给 程序 的 参数 压 入 进程 的 栈 
中 。 从 栈 区 域 的 底部 (高 位 地 址 ) 开始 依次 是 各 参数 的 值 、-1、 各 参数 
的 地 址 、 参 数 的 数量 。 各 参数 的 值 的 结尾 字符 为 0 (NULL ) 。 参 数 的 
数量 、 各 参数 地 址 的 起 始 位 置 分 别 对 应 C 语言 程序 main(int argc, 
char**argv) 的 两 个 参数 (图 3-13) 。 


虚拟 地 址 空间 


<4— INt argc 
4— char **argv 


Ee 
参数 0 参数 1 


Oxffff 参数 Nn 


图 3-13 传递 给 程序 执行 文件 的 参数 


0 exec 的 进程 数量 被 限制 为 NEXEC (=3 ) (代码 清单 3- 
30) 。 


代码 清单 3-30 NEXEC (param.h) 


1 #define NEXEC 3 


问 执 行程 序 传递 参数 、 将 程序 执行 文件 从 块 设备 读 取 至 内 存 ， 这 些 处 
理 都 会 大 量 使 用 块 设备 的 缓冲 区 (参见 第 7 章 ) 。 此 外 ， 在 等 待 块 设 
备 处 理 完 毕 的 过 程 中 切换 执行 进程 的 可 能 性 很 大 ， 考 虑 到 新 的 执行 进 
程 有 可 能 再 次 执行 exec ， 从 而 导致 块 设备 的 绥 冲 区 空间 不 足 ， 因 此 
有 必要 加 以 限制 。 


exec( ) 为 系统 调用 exec 的 处 理 函 数 ( 表 3-21， 代码 清单 3-31) 。 


( 
向 系统 调用 人 处理 函数 传递 参数 的 方法 详 见 见 第 5 章 
表 3-21 系统 调用 exec 的 参数 


字符 串 的 起 始 地 址 ， 该 字符 串 代 表 程序 执行 文件 路 径 


sree empresa 


代码 清单 3-31 exec() (ken/sys1.c) 


1 exec() 

2 

3 int ap, na, nc, *bp; 

4 int ts, ds, sep; 

5 register c, *ip; 

6 register char *cp; 

7 extern uchar; 

8 

9 /* 正当 性 检查 */ 
10 ip = namei(&uchar, 0); 
11 if(ip == NULL) 
12 return; 
13 while(execnt >= NEXEC) 
14 sleep(&execnt, EXPRI); 
15 execnt++; 
16 bp = getblk(NODEV); 
17 if(access(ip, IEXEC) || (ip->i_mode&IFMT)!=0) 
18 goto bad; 
19 
20 /* 将 参数 存 入 缓冲 区 */ 
21 cp = bp->b_addr; 
22 na = 0; 
23 nc = 0) 
24 while(ap = fuword(u.u_arg[1])) { 
25 na++ ， 
26 if(ap == -1) 
27 goto bad ; 
28 u.u_arg[1] =+ 2; 


29 for(;;) { 


30 c = fubyte(ap++); 


31 if(c == -1) 

32 goto bad; 

33 *Cp++ = C; 

34 nc++， 

35 if(nc > 510) { 

36 U,.U_error = E2BIG; 
37 goto bad; 

38 } 

39 if(c == 0) 

40 break; 

41 } 

42 } 

43 if((nc&1) != 0) { 

44 *Cp++ = 0) 

45 ncC++ 

46 } 

47 

48 /* 读 取 程序 执行 文件 的 文件 涉 */ 

49 uU.u_base = &u.u_arg[0]; 

50 U.U_count = 8; 

51 u.u_offset[1] = 909; 

52 u.u_offset[0] = 909; 

53 u.u_segflg = 1; 

54 readi(ip); 

55 u.u_segflg = 0; 

56 if(u.u_error) 

57 goto bad; 

58 sep = 0; 

59 if(u.u_arg[0] == ©0407) { 

60 u.u_arg[2] =+ u.u_arg[1]; 
61 u.u_arg[1] = 9; 

62 } else 

63 if(u.u_arg[0] == 0411) 

64 sep++; else 

65 if(u.u_arg[0] != ©0410) { 

66 U.Uu_error = ENOEXEC,; 

67 goto bad; 

68 } 

69 if(u.u_arg[1]!=0 && (ip->i flag&ITEXT)==0 && ip- 
>i_count!=1) { 

70 U.Uu_error = ETXTBSY,; 

71 goto bad; 

72 } 

73 

74 ts = ((u.u_arg[1]+63)>>6) & 01777; 
75 ds = ((u.u_arg[2]+u.u_arg[3]+63)>>6) & 01777; 
76 if(estabur(ts, ds, SSIZE, sep)) 
77 goto bad; 

78 


79 /* 读 取 程序 执行 文件 的 代码 部 分 */ 


u.u_prof[3] = 0; 

xfree( ); 

expand (USIZE); 

xalloc(ip); 

c = USIZE+ds+SSIZE; 

expand(c ) ; 

while(--c >= USIZE) 
clearseg(u.u_procp->p_addr+c); 


/* 读 取 程序 执行 文件 的 数据 部 分 */ 
estabur(0, ds, 0, 0); 

U,U_base = 0; 

u.u_offset[1] = 020+u.u_arg[1]; 
U.Uu_count = u.u_arg[2]; 
readi(ip); 


.U_tsize = 
.U_dsize = ds; 
.U_Ssize = SSIZE; 

.U_sep = sep; 

estabur(u.u_tsize, u.u_dsize, u.u_ssize, 


/* 将 参数 压 入 栈 */ 

cp = bp->b_addr; 

ap = -nc - na*2 - 4; 

u.u_arQO[R6] = ap; 

suword(ap, na); 

c= -nc; 

while(na--) { 
suword(ap=+2, c); 
do 


U 
U 
U 
U 


subyte(c+t+, *cp); 
while(*cp++); 


suword(ap+2, -1); 


/* 设置 SUID、SGID */ 
If ((u.u_procp->p_flag&STRC)==0) { 
if(ip->i_mode&ISUID) 
if(u.u_uid != 0) { 
U.U_uUid = ip->i_uid; 
u.u_procp->p_uid = ip->i_uid; 


} 
if(ip->i_mode&ISGID) 
u.u_gid = ip->i _ gid; 


/* 清空 信号 和 寄存 器 */ 
c = ip; 


for(ip = &u.u_signal[0]; ip < &u.u_signal[NSIG]; ip++) 


if((*ip & 1) == 0) 


Uu.Uu_sep); 


131 *ip = 0; 


132 for(cp = &regloc[0]; cp < &regloc[6];) 
133 U.Uu_arO[*cp++] = 0; 

134 U.U_arg[R7] = 0; 

135 for(ip = &u.u_fsav[0]; ip < &u.u_fsav[25];) 
136 *ip++ = 0) 

137 ip = C; 

138 

139 bad: 

140 iput (ip); 

141 brelse(bp); 

142 if(execnt >= NEXEC) 

143 wakeup(&execnt ) ; 

144 execnt--; 

145 } 


10~12 ”通过 用 户 作为 参数 指定 的 程序 执行 文件 的 路 径 ， 取 得 


inode[] 中 对 应 的 该 文件 的 元 素 。 如 条 用 户 指 定 了 不 存在 的 文件 
路 径 ， 或 是 不 具备 访问 该 文件 的 权限 时 ，namei( ) 将 返回 NULL 


13~15 ”确认 正在 执行 的 exec( ) 的 进程 数 小 于 NEXEC 。 如 果 大 
于 或 等 于 NEXEC 则 调用 Sleep( ) 进入 睡眠 状态 ， 直 到 正在 执行 
的 exec( ) 的 进程 数 小 于 或 等 于 NEXEC 。 通 过 此 处 的 检查 后 递增 
execnt 的 值 ， 表 示 正 在 执行 exec( ) 的 进程 数 又 增加 了 1 个 。 
execnt 为 全 局 变量 (代码 清单 3-32) 


代码 清单 3-32 execnt (system.h) 


1 int execnt; 


16 ”执行 getblk() 取得 尚未 被 分 配给 其 他 块 设 备 的 块 设备 缓冲 
区 ， 并 将 其 作为 处 理 参数 时 的 工作 内 存 。 大 概 开发 人 员 认 为 与 通 
过 malloc() 和 mfree() 分 配 内 存 相 比 ， 这 种 做 法 更 简单 。 


17~18 ”执行 access( ) 检查 程序 文件 的 执行 权限 ， 同 时 确认 该 
文件 不 是 特殊 文件 。 


21~23 ”将 传递 给 程序 的 参数 存 入 刚才 取得 的 缓冲 区 。 首 先 将 cp 
设 定 为 缓冲 区 数据 区 域 的 地 址 ， 然 后 将 na (参数 的 数量 ) 和 nc 
(参数 的 总 字 节 数 ) 清 0。 


24 ”依次 处 理 用 户 传递 给 程序 的 参数 。fuword ( ) 是 从 上 一 模式 
所 示 的 虚拟 地 址 空间 向 当前 模式 所 示 的 虚拟 地 址 空间 复制 的 1 个 
字 长 的 数据 。u.u_arg[1] 此 时 为 系统 调用 exec 的 第 2 个 参数 
的 地 址 。 


25 每 处 理 1 个 参数 ，na 都 会 加 1。 当 这 个 while 处 理 结 
时 ，na 的 值 等 于 参数 的 数量 。 


26~27 fuword( ) 处 理 失败 时 返回 -1， 此 时 跳 转 到 bad 进行 错 
误 处 理 。 


28 将 u.u_arg[1] 增加 1 个 字 以 便 访问 下 一 个 参数 。 


29~41 ”将 参数 以 字 节 为 单位 依次 存 入 缓冲 区 ， 将 ap 设 定 为 指向 
该 参数 的 指针 。fubyte( ) 与 fuword( ) 相似 ,但 是 处 理 单位 为 
1 个 字 节 。 参 数 以 字 节 为 单位 存 入 缓冲 区 。fubyte( ) 发 生 错误 时 
返回 -1， 此 时 跳 转 到 bad 进行 错误 处 理 。 


每 处 理 1 个 字 节 ，nc 都 会 加 1。 当 这 个 while 处 理 结束 时 ，nc 
的 值 等 于 参数 的 总 字 节 数 。 因 为 缓冲 区 的 长 度 只 有 512 字 节 ， 当 
nc 大 于 510 时 将 认为 参数 的 长 度 过 长 ， 此 时 跳 转 到 bad 进行 错 
误 处 理 。 


由 于 各 参数 都 以 0 (NULL ) 结尾 ， 因 此 当 fubyte( ) 取得 的 值 为 
0 时 ， 转 而 处 理 下 一 个 参数 。 当 存 入 缓冲 区 的 处 理 结束 后 ， 缓 剖 区 
中 保存 的 数据 形式 为 “参数 0 参数 1... 参数 n”。 


43~46 ” 当 nc 的 值 为 奇数 时 ， 回 缓冲 区 中 追加 1 个 字 和 使 数据 长 
度 成 为 偶数 。 因 为 系统 硕 望 以 字 为 单位 进行 处 理 。 


49~53 ” 读 取 程序 文件 的 文件 涉 。readi( ) 是 用 于 读 取 文 件 内 容 
的 函数 ， 其 参数 由 user 结构 体 指定 ( 表 3-22) 。 


表 3-22 readi0 的 参数 
F 保 存 读 取 数 据 的 地 址 


i a 


56~57 ”如 果 readi( ) 在 执行 ， 误 ， 将 错误 代码 保存 至 
u.U_error ， 并 跳 转 到 bad 进行 错误 处 理 。 


通过 readi( ) 读 取 的 数据 ， 以 表 3-23 所 示 的 形式 保存 于 
u.u_arg[] 中 。 


表 3-23 ”readi0 的 执行 结果 


om 


58 ”将 sep 设 定 为 0。 


59~68 ”根据 魔术 数字 进行 分 支 处 理 。 魔 术 数 字 为 0407 时 不 使 用 
代码 段 ， 而 是 将 代码 和 数据 一 并 读 取 至 数据 区 域 。 将 
u.Uu_arg[2] 设置 为 代码 长 度 和 数据 长 度 之 和 , 将 u,u_arg[1I] 
清 0。 


如 果 磨 术 数 字 为 0407、0410、0411 以 外 的 值 则 认为 不 是 程序 的 执 
行文 件 ， 并 跳 转 到 bad 进行 错误 处 理 。 

69~72 ”如果 代码 的 长 度 (u,u_arg[1] ) 不 为 0， 该 程序 文件 又 
被 作为 数据 文件 打开 ， 则 进行 错误 处 理 。 


74~75 ”计算 代码 段 和 数据 区 域 的 长 度 。 段 的 长 度 以 64 字 闻 为 单 
位 进行 管理 。 


76~77 ”执行 estabur() 更 新 用 户 APR 和 用 户 空间 6 。SSIZE 
0 长 度 ， 被 定义 为 20 (x64 字 节 ) (代码 清单 3- 
33) 。 


6 此 处 调用 estabur() 主要 是 通过 设置 APR 来 检查 各 个 段 长 度 是 否 全 
estabur() 正式 设置 APR。 审 校 者 注 


次 调用 


oy 
N 
IN 
沙 


代码 清单 3-33 SSIZE (param.h) 


1 #define SSIZE 20 


80 ”从 此 处 开始 进行 代码 段 和 数据 段 的 初始 化 处 理 。 百 先 将 用 于 
统计 的 变量 清 0。 


81 ”执行 xfree( ) 释放 当前 使 用 的 代码 段 。 如 果 在 此 之 前 依次 
执行 了 fork 和 exec ， 那 么 到 此 为 止 就 终于 告别 了 父 进程 所 使 用 
的 代码 段 。 


82 ”执行 expand() 将 数据 段 缩 小 为 与 user 结构 体 相 同 的 长 
度 。 


83 ”执行 xalloc( ) 分 配 代码 段 使 用 的 内 存 。 如 果 未 使 用 代码 
段 ， 则 在 xalloc( ) 中 不 做 任何 处 理 。 


84~87 ”执行 expand( ) 确保 数据 区 域 。 由 于 位 于 user 结构 体 
之 后 的 区 域 留 有 过 去 的 数据 ， 因 此 需要 将 其 清 0。 


90 ”执行 estabur() ， 将 进程 的 数据 区 域 的 起 始 位 置 变更 至 虚 
拟 地 址 为 0 的 位 置 7 。 


91~94 ”执行 readi( ) ， 将 程序 读 取 至 进程 的 数据 区 域 。 魔 术 数 
字 为 0407 时 读 取 代码 和 数据 ， 魔 术 数 字 为 0410 时 只 读 取 数据 。 
偏 移 量 020 表示 程序 文件 头 的 长 度 ( 表 3-24) 。 


“此 处 调用 estabur( ) 是 将 数据 段 的 虚拟 地 址 设 为 0 (物理 地 址 并 没有 变 ) ， 原 因 是 之 后 调 
j readi( ) 的 参数 要 求 读 取 进程 数据 区 到 虚拟 地 址 为 0 的 位 置 。 也 可 以 将 数据 段 物 理 地 址 
映射 到 其 他 虚拟 地 址 上 ， 然 后 将 这 一 虚拟 地 址 作为 参数 传 给 readi( ) 。 不 过 用 0 更 为 方 


站 
便 审 校 者 注 


表 3-24 readi0 的 参数 


0。 将 程序 读 取 至 虚拟 地 址 空间 地 址 为 0 的 位 置 


0407 时 为 代码 的 起 始 位 置 ，0410 时 为 数据 的 起 始 位 置 
0407 时 为 代码 和 数据 长 度 之 和 ，0410 时 为 代码 的 长 度 


egflag 


U.U_S 


96~100 ”执行 estabur( ) 最 终 确定 用 户 空 间 。 魔 术 数 字 为 0410 
上 时， 通过 estabur( ) 设 定 用 户 APR， 对 虚拟 地 址 空间 进行 如 下 

变更 : 将 代码 段 起 始 地 址 调整 至 虚拟 地 址 为 0 处 ， 数 据 区 域 起 始 

地 址 以 8KB 为 边界 对 齐 。 


103 ”从 这 里 开始 将 保存 于 绥 冲 区 的 参数 转 存 至 栈 区 域 。 首 先 将 
cp 设 定 为 缓冲 区 的 数据 区 域 的 地 址 。 

104~105 “计算 栈 指针 的 地 址 ， 并 设 定 用 户 进程 的 sp。 请 注意 ， 
因为 栈 区 域 的 起 始 地 址 为 0xffff ， 换 算 成 int 型 将 为 负数 (图 
3-14) 。 


长 度 ( 字 节 ) 
sp >| ”参数 的 数量 | > 2 
参数 0 的 地 址 
ao 
> 


参数 n 的 地 


参数 0 参数 1 


参数 n 


Oxffff 


图 3-14 计算 栈 指针 的 地 址 


106 ”将 na (参数 的 数量 ) 的 值 设 定 至 栈 指针 指向 的 用 户 空间 地 
址 。 suword() 是 从 当前 模式 的 虚拟 地 址 空间 同 前 一 模式 的 虚拟 
地 址 空间 复制 的 数据 。 


107 将 c 设 定 为 保存 参数 的 用 户 空 间 地 址 。 
108~113 ”将 参数 及 地 址 存 入 栈 区 域 。 
114 ”将 参数 地 址 的 下 一 地 址 设置 为 -1。 


117 ”如 果 没 有 处 于 跟踪 状态 〈 详 见 第 6 章 ) ， 则 从 此 处 开始 设置 
SUID 和 SGID 。 


118~122 ”如 果 inodef[] 中 代表 该 程序 文件 的 元 素 的 标志 位 
ISUID 已 被 设置 ， 且 当前 用 户 并 非 超级 用 户 (u.u_uid 不 为 
0) ， 则 将 该 元 素 的 成 员 inode.i_uid 设 定 至 u.u_uid 。 


123~124 ”如 果 inode[] 中 代表 该 程序 文件 的 元 素 的 标志 位 
ISGID 已 被 设置 ， 则 将 该 元 素 的 成 员 ijnode .i_gid 设 定 至 
U,U_ gid 。 


128 ”从 此 处 开始 对 信号 和 寄存 右 进 行 初始 化 。 


129~131 ”如 果 Uu.u_signal[n] 的 值 为 偶数 则 清 0， 如 果 为 奇数 
则 保留 原 有 数据 。 如 果 在 此 之 前 依次 执行 了 fork 和 exec ， 
u.u_signal[n] 的 值 则 为 从 父 进程 继承 的 数据 。 关 于 
u.u_signal[n] 的 数据 含义 将 在 第 6 章 中 说 明 。 


132~134 将 用 ， 导 进程 的 r0~T5、Tr7 的 值 清 0。 作 为 栈 指针 的 r6 已 


在 第 105 行 设 定 完 毕 。 


135~136 ”将 进行 浮动 小 数 点 运算 的 寄存 姨 清 0。 此 处 理 与 PDP- 


11/40 无 关 。 
140 将 inode[] 中 代表 该 程序 执行 文件 的 元 素 的 参照 计数 器 减 
1 oO 


141 ”释放 用 于 参数 处 理 的 缓冲 区 。 


142~145 ”如 果 正 在 执行 的 exec( ) 的 进程 数 小 于 或 等 于 NEXEC 
， 则 唤醒 其 他 等 待 进入 exec( ) 处 理 的 进程 。 同 时 递减 execnt 
， 表 示 正 在 执行 的 exec( ) 的 进程 数 减 少 了 1 个 。 


estabur() 


estabur() 用 于 更 新 user 结构 体 中 的 用 户 APR 数据 
user.u_uisa[] 和 user.u_uisd[] ( 表 3-25、 代 码 清单 3-34 ) ， 
Re sureg() ， 将 更 新 的 数据 反映 到 硬件 的 用 户 APR， 更 
新 用 户 空间 。 


estabur() 接受 4 个 参数 。PPDA 和 数据 区 域 的 总 长 度 (nd ) 与 栈 
区 域 的 长 度 (ns ) 之 和 为 数据 段 的 长 度 。 由 于 PDP-11/40 对 代码 段 和 
数据 段 采用 相同 的 APR 进行 管理 (sep 为 0) ， 因 此 本 书 对 sep 为 1 
时 的 处 理 不 进行 说 明 。 


estabur() 对 与 用 户 PAR、PDR 相对 应 的 user.u_uisa[] 、 
user .u_uisd[] 进行 设 定 。 首 先 以 128x64 字 节 (8KB) 为 单位 分 配 
供 代 码 段 使 用 的 内 存 ， 余 数 作 为 最 后 一 页 分 配给 代码 段 ， 并 将 PDR 设 
定 为 只 读 。 然 后 以 128x64 字 节 为 单位 分 配 供 数 据 区 域 使 用 的 内 存 ， 在 
数据 区 域 起 始 位 置 的 PAR 附加 与 user 结构 体 相同 长 度 的 内 存 ， 余 数 
作为 最 后 一 页 分 配给 数据 区 域 ， 并 将 PDR 设 定 为 允许 读 写 。 最 后 分 配 
供 栈 使 用 的 页 。 由 于 栈 向 低位 地 址 方向 扩展 ， 因 此 从 最 高 位 的 页 开始 
回 低 位 进行 分 配 ， 余 数 作为 最 后 一 页 分 配给 栈 区 域 。 除 了 将 PDR 设 定 
为 允许 读 写 之 外 ， 还 设置 ED 标志 位 表示 向 低位 方向 扩展 。 


对 代码 段 和 数据 段 的 PAR， 分 别 设 定 从 0 开始 的 相对 值 。 当 代码 段 、 
` 栈 区 域 的 长 度 均 为 192x64 字 节 时 ， 用 户 APR 的 状态 如 图 
3-15 所 不 。 


user.u_uisal] USer.u_ulsd[] 


64 RW ED 
127 RW 


图 3-15 ”由 estabur0 设 定 的 用 户 APR 的 示例 
表 3-25 estabur0 的 参数 


参数 


nt “| 代码 段 的 长 度 〈 单 位 为 64 字 ) 


PPDA 和 数据 区 域 的 长 度 之 和 (单位 为 64 字 节 ) 


栈 区 域 的 长 度 (单位 为 64 字 节 ) 


是 否 对 代码 段 和 数据 段 的 APR 进行 分 别管 理 。PDP-11/40 的 环境 下 为 0 


stabur(nt, nd, ns, sep) 


register a, *ap, *dp; 


/* 正当 性 检查 */ 
if(sep) { 
if(cputype == 40) 
goto err; 
if(nseg(nt) > 8 || nseg(nd)+nseg(ns) > 8) 
goto err; 
} else 
if(nseg(nt)+nseg(nd)+nseg(ns) > 8) 
goto err; 
if(nt+nd+ns+USIZE > maxmem) 
goto err; 


/* 分 配 代码 段 */ 
a = 0; 
ap = &u.u_uisa[0]; 
dp = &u.u_uisd[0]; 
while(nt >= 128) { 
*dp++ = (127<<8) | RO; 
*ap++ = a; 


a =+ 128; 
nt =- 128; 

} 

if(nt) { 
*dp++ = ((nt-1)<<8) | RO; 
*ap++ = a; 

} 

if(sep) 

while(ap < &u.u_uisa[8]) { 
*ap++ = 0) 
*dp++ = 0) 


* 分 配 数 据 区 域 */ 

a = USIZE; 

while(nd >= 128) { 

*dp++ = (127<<8) | RW; 
*ap++ = a; 


a =+ 128; 
nd =- 128; 
} 
if(nd) { 
*dp++ = ((nd-1)<<8) | RW; 
*ap++ = a; 
a =+ nd; 
} 
while(ap < &u.u uisa[8]) { 
*dp++ = 0) 
*ap++ = 0) 
} 
if(sep) 


while(ap < &u.u_uisa[16]) { 


56 *dp++ = 0©; 

57 *ap++ = 0; 

58 } 

59 

60 /* 分 配 栈 区 域 */ 

61 a =+ Ns; 

62 while(ns >= 128) { 

63 a =- 128; 

64 ns =- 128; 

65 *--dp = (127<<8) | RW; 
66 *--ap = a; 

67 } 

68 if(ns) { 

69 *--dp = ((128-ns)<<8) | RW | ED; 
70 *--ap = a-128; 

71 } 

72 if(!sep) { 

73 ap = &u.u_uisa[0]; 

74 dp = &u.u_uisa[8]; 

75 while(ap < &u.u_uisa[8]) 
76 *dp++ = *ap++; 

77 ap = &u.u_uisd[0]; 

78 dp = &u.u_uisd[8]; 

79 while(ap < &u.u_uisd[8]) 
80 *dp++ = *ap++; 

81 } 

82 sureg( ); 

83 return(0); 

84 

85 err 

86 U.U_error = ENOMEM， 

87 return(-1); 

88 } 


12~13 nseg() 是 将 以 64 字 太 为 单位 的 块 数 转换 为 页 数 的 函 
数 。 如 来 尽 页 数 大 于 8 则 出 销 。 


14~15 ”如 果 需 要 的 块 数 (以 64 字 贡 为 单位 ) 大 于 能 够 使 用 的 内 
存 容量 上 限 则 出 销 。maxmem 表示 能 够 使 用 的 物理 内 存 容量 上 限 ， 
在 系统 局 动 时 设 定 。 


18~30 ”对 代码 段 使 用 的 user 结构 体 中 的 APR 进行 设 定 。 


38~53 ”对 数据 区 域 使 用 的 user 结构 体 中 的 APR 进行 设 定 。 
为 数据 段 起 始 位 置 的 16x64 字 节 被 分 配给 PPDA， 因 此 需要 将 
PAR 与 USIZE (16) 相 加 。 当 数据 区 域 分 配 完毕 时 ， 到 APR6 为 
止 的 区 域 被 清 0。 


61~71 ”分 配 栈 区 域 使 用 的 页 。 


82 ”执行 sureg( ) ， 将 user 结构 体 中 的 APR 反映 到 硬件 的 用 
户 APR， 以 更 新 用 户 空间 。 


83 ”estabur() 执行 成 功 时 返回 0。 


sureg() 


sureg( ) 将 执行 进程 的 user 结构 体 中 保存 的 APR 数据 反映 到 硬件 的 
用 户 APR， 以 更 新 用 户 空间 (代码 清单 3-35 ) 。sureg() 除了 在 
estabur() 中 更 新 user 结构 体 的 APR 数据 时 被 调用 外 ， 在 切换 执 
行进 程 时 也 会 被 调用 。 


因为 user 结构 体 中 保存 的 APR 数据 采用 相对 地 址 ， 在 转 存 至 硬件 的 
用 户 APR 时 ， 需 要 根据 分 配给 进程 的 内 存 区 域 的 物理 地 址 进行 补正 。 
代码 段 需要 将 text ,x_caddr (参照 第 4 章 ) 、 数 据 段 需 要 将 
proc.p_addr 分 别 与 补正 值 相 加 (图 3-16) 。 


User.u_uisa[l]、user.u_uisd|] 
<4— text.x_caddr 
A 代码 段 


ES <4— proc.p_addr 


物理 内 存 


图 3-16 sureg0 


代码 清单 3-35 sureg0 (ken/main.c) 


1 sureg() 

2 

3 register *up, *rp, a; 
4 

5 /* 设 定 PAR */ 

6 a= Uu.u_procp->p_addr; 
7 up = &u.u_uisa[16]; 

8 rp = &UISA->r[16]; 

9 if(cputype == 40) { 
10 up =- 8; 

11 rp =- 8; 

12 } 

13 

14 while(rp > &UISA->r[0]) 
15 *--rp = *--up + a; 
16 if((up=u.u_procp->p_textp) != NULL) 
17 a =- Up->x_caddr; 
18 

19 /* 设 定 PDR */ 

20 up = &u.u_uisd[16]; 

21 rp = &UISD->r[16]; 


22 if(cputype == 40) { 


} 
26 while(rp > &UISD->r[9]) { 
* 二 *--Uup; 


28 if((*rp & WO) == 0) 
29 rp[ (UISA-UISD)/2] =- a; 


6~15 ”根据 数据 段 的 物理 地 址 对 user 结构 体 的 APR 数据 进行 补 
正 ， 并 用 补正 后 的 值 更 新 用 户 PAR。UISA 为 用 户 PAR0 的 地 址 
(代码 清单 3-36) 。 


代码 清单 3-36 UISA (seg.h) 


1 #define UISA ©0177640 


16~17 ”如 果 执 行进 程 使 用 代码 段 ， 则 根据 代码 段 的 物理 地 址 确定 


补正 值 ， 并 将 其 赋予 a 。 

20~30 ”使 用 user 结构 体 的 APR 数据 更 新 PDR。 在 设 定 读 取 专 
用 代码 段 的 PDR 时 ， 将 对 应 的 PAR 寄存 器 的 值 与 第 17 行 设 定 的 
补正 值 相 加 。UDSA 为 用 户 PDR0 的 地 址 (代码 清单 3-37) 。 


代码 清单 3-37 UDSA (seg.h) 


1 #define UDSA ©0177660 


expand() 


expand( ) 用 来 扩展 或 缩小 数据 段 ( 表 3-26， 代 码 清单 3-38 ) 。 缩 小 
数据 段 时 调用 mfree( ) 释放 不 需要 的 内 存 。 扩 展 数据 段 时 调用 
malloc( ) 重新 分 配 与 数据 段 全 体 长 度 相同 的 内 存 ， 并 将 其 指向 用 户 
空间 (图 3-17 ) 。 如 果 出 现 内 存 不 足 的 情况 ， 则 将 进程 从 内 存 换 出 至 
交换 空间 ， 直 到 可 以 分 配 足够 的 内 存 (图 3-18 ) 。expand( ) 接受 为 
数据 段 指定 的 新 的 长 度 作为 参数 。 


缩小 扩展 
物理 内 存 
proc.p_addr—y> proc.p_addr—> 
调用 mfree() 
调用 mfreel() 释放 内 存 
proc.p_addF—> 


调用 malloc() 
分 配 内 存 


在 此 之 后 调用 sureg() 更 新 用 户 APR 并 更 新 用 户 空间 


图 3-17 expand0 


物理 内 存 


proc.p_addr 一 各 


调用 mfree() 


本 


和 


sched() 处 理 


图 3-18 暂时 将 数据 换 出 内 存 
表 3-26 ”expand0 的 参数 


newsize 数据 段 的 新 的 长 度 (以 64 字 节 为 单位 


代码 清单 3-38 expand() (ken/slp.c) 


xpand(newsize) 


[en 


int i, n; 
register *p, alil, a2; 
u.u_procp; 


p->p_size; 
>p_size = newsize,; 


ON=OORRODP 


p 
n 
p- 


9 al = p->p_addr; 


10 if(n >= newsize) { 

11 mfree(coremap, n-newsize, alt+newsize); 
12 return; 

13 

14 savu(u.u_rsav); 

15 a2 = malloc(coremap, newsize); 

16 if(a2 == NULL) { 

17 savu(Uu.u_ssav); 

18 xswap(p, 1, n); 

19 p->p_flag =| SSWAP; 

20 swtch( ) ， 

21 /* 从 退出 expand() 的 地 方 继续 运行 */ 
22 } 

23 p->p_addr = a2; 

24 for(i=0; i<n; i++) 

25 copyseg(ali+i, a2++); 

26 mfree(coremap, n, a1); 

27 retu(p->p_addr); 

28 sureg(); 

29 } 


8 ”更 新 表示 数据 段 长 度 的 proc.p_size 。 


10~13 ”需要 缩小 数据 段 长 度 ， 可 调用 mfree( ) 释放 不 再 需要 的 
内 存 并 返回 。 


14~15 ”如 果 需 要 扩展 ， 则 调用 malloc( ) 分 配 供 数据 段 使 用 的 
新 内 存 。 因 为 在 第 27 行将 执行 retu() ， 所 以 在 此 处 执行 
savu( ) 以 提前 保存 r5 和 1r6。 


16~22 ”如 果 出 现 内 存 不 足 的 情况 ， 则 将 进程 从 内 存 换 出 至 交换 空 
间 。 当 进程 被 换 入 内 存 之 后 再 次 尝试 分 配 内 存 ， 然 后 执行 
swtch( ) 切换 执行 进程 。 当 该 进程 再 次 成 为 执行 进程 时 ， 从 退出 
expand( ) 的 地 方 继续 运行 。 


23~26 “将 数据 段 的 内 容 复制 到 新 分 配 的 内 存 区 域 。 将 
proc.p_addr 设置 为 狐 分 配 的 内 存 区 域 的 地 址 ， 并 调用 
mfree( ) 释放 原 有 的 数据 段 。 


27~28 ”因为 数据 段 的 地 址 已 经 更 改 ， 所 以 执行 retu( ) 和 
sureg() 以 更 新 用 户 空间 。 


3.5 ”进程 的 终止 


当 程 序 执行 完毕 之 后 ， 该 进程 的 运行 将 被 终止 ， 被 其 占用 的 资源 也 会 
释放 。 进 程 的 终止 处 理 包括 一 下 两 个 步骤 。 


1. 用 户 程序 执行 系统 调用 exit ， 使 进程 进入 僵尸 状态 (SZOMB ) 。 
将 user 结构 体 换 出 至 交换 空间 ， 同 时 释放 被 其 占用 的 内 存 。 


2. 父 进程 通过 执行 系统 调用 wait 取得 子 进程 的 完结 状态 ， 并 负责 清 
理 处 于 僵尸 状态 的 子 进程 。 


系统 调用 exit 
系统 调用 exit 的 主要 功能 如 下 所 示 。 

。 天 闭 打 开 的 文件 

。 将 当前 目录 的 参照 计数 器 减 1 

。 释放 代码 段 

。 将 user 结构 体 复制 到 交换 空间 

。 释放 数据 段 

。 使 进程 进入 僵尸 状态 (SZOMB ) 

。 唤醒 父 进 程 和 init 进程 

。 如 果 当 前 进程 存在 子 进程 ， 则 将 其 设置 为 jnit 进程 的 子 进程 
1 交换 空间 的 user 结构 体 将 在 父 进程 清理 子 进程 时 投入 使 


如 果 由 于 程序 自身 的 错误 ， 使 得 进程 在 进入 僵尸 状态 时 没有 正确 清理 
属于 自己 的 的 子 进 程 ， 那 么 这 些 子 进 程 将 处 于 无 人 管理 的 状态 。 
此 ， 当 被 终止 的 进程 存在 子 进程 时 ， 将 委托 init 进程 (proc[1]) 
对 子 进 程 进行 清理 。init 进程 在 系统 启动 时 被 创建 ， 该 进程 负责 清理 
终止 的 进程 、 初 始 化 终端 等 工作 (图 3-19 ) 


CT OD init 进程 的 子 进程 则 清理 
QO ts 
© 四 
wakeup!) “(5) 人 六 ~ 
日 I @ 只 此 2 
(4 人---exitl (@---- 僵 尸 状态 由 2 
+®© (®) G) (© % @ 


图 3-19 ”系统 调用 exit 


在 处 理 的 最 后 阶段 执行 swtch( ) 切换 执行 进程 。 期 待 父 进程 对 当前 进 
程 ，init 进程 对 原本 属于 目 己 的 子 进程 进行 清理 。 因 为 已 进入 僵尸 状 
态 ， 执 行 系统 调用 exit 的 进程 不 会 再 次 成 为 执行 进程 。 


如 果 用 户 程序 执行 了 系统 调用 exit ， 内 核 的 rexit( ) 将 被 执行 ( 表 
3-27， 代 码 清单 3-39 ) 。rexit() 会 调用 exit() 终止 进程 运行 〈 代 
码 清单 3-40 ) 。 系 统 调 用 exit 的 参数 为 进程 的 完结 状态 。 完 结 状态 
保存 在 user .u_arg[9] 中 。 当 父 进程 进行 清理 处 理 时 ， 

user .u_arg[9] 以 高 位 8 比特 为 完结 状态 、 低 位 8 比特 为 错误 信息 
的 格式 传递 给 父 进程 。 


表 3-27 系统 调用 exit 的 参数 


进程 的 完结 状态 


代码 清单 3-39 rexit0) (ken/sys1.c) 


exit() 


{ 


1 
2 
3 
4 u.u_arg[90] = u.u_arO[RO] << 8; 
5 
6 


exit(); 


} 


代码 清单 3-40 exit() (ken/sys1.c) 


1 

2 

3 register int *q, a; 

4 register struct proc *p; 

5 

6 u.u_procp->p_flag =& ~STRC; 

7 for(q = &u.u_signal[0]; qd < &u.u_signal[NSIG];) 
8 *q++ 三 41; 

9 for(q = &u.u_ofile[0]; q < &u.u_ofile[NOFILE]; q++) 
10 if(a = *q) { 
11 *q = NULL; 
12 closef(a); 
13 
14 iput(u.u_cdir); 
15 xfree( ); 
16 a = malloc(swapmap, 1); 
17 if(a == NULL) 
18 panic("out of swap"); 
19 p = getblk(swapdev, a); 
20 bcopy(&u, p->b_addr, 256); 
21 bwrite(p); 
22 q = Uu.u_procp; 
23 mfree(coremap, dq->p_size, q->p_addr); 
24 q->p_addr = a; 
25 q->p_stat = SZOMB; 
26 
27 loop: 
28 for(p = &proc[0]; p < &proc[NPROC]; p++) 
29 if(q->p_ppid == p->p_pid) { 
30 wakeup(&proc[1]); 
31 wakeup(p); 
32 for(p = &proc[0]; p < &proc[NPROC]; p++) 
33 if(q->p_pid == p->p_ppid) { 
34 p->p_ppid = 1; 


35 if (p->p_stat == SSTOP) 


36 setrun(p); 


} 
38 swtch( ) ， 
} 
40 q->p_ppid = 1 
41 goto loop; 


6 ”如 果 当 前 处 于 跟踪 处 理 中 ， 则 将 跟 踩 标 志 位 设置 为 无 效 。 
7~8 ”为 了 忽略 所 有 信和 号， 将 所 有 Uu.u_signal[n] 设置 为 1。 


9~13 ”关闭 所 有 由 当前 进程 打开 的 文件 。 
14 ”递减 当前 目录 的 参照 计数 器 。 

15 ”释放 代码 段 。 

16~18 ”分 配 交 换 空 间 。 


19~21 执行 getblk() ， 取 得 交换 磁盘 (用 作 交 换 空间 的 块 设 
备 ) 的 块 设备 缓冲 区 。 然 后 执行 bcopy( ) 将 包含 user 结构 体 在 
内 的 位 于 数据 段 头 部 的 512 字 节 复制 到 上 壕 缓冲 区 ， 再 执行 
bwrite() 将 缓冲 区 内 的 数据 写 入 交换 空间 。 


22~25 ”释放 内 存 中 的 数据 段 。 然 后 把 proc.p_addr 设置 为 交换 
磁盘 中 的 块 编号 ， 再 将 proc.,p_stat 设置 为 SZOMB 。 


28~39 ”唤醒 父 进程 和 init 进程 。 如 果 存 在 尚未 清理 的 子 进程 ， 
则 将 其 父 进 程 设置 为 init 进程 。 另 外 ， 如 果 该 子 进程 处 于 
SSTOP 状态 ， 则 解除 该 状态 并 将 其 设置 为 可 执行 状态 。 最 后 执行 
swtch( ) 切换 执行 进程 。 因 为 proc.p_stat 为 SZOMB ， 所 以 
当前 进程 不 会 再 次 执行 。 


40~41 ”如 采 由 于 某 种 原因 当前 进程 中 才 不 存在 父 进程 ， 则 将 其 父 
进程 设置 为 Init 进程 ， 并 返回 第 28 行 再 次 执行 。 


系统 调用 wait 


如 果 用 户 程序 执行 了 系统 调用 wait ， 当 前 进程 的 运行 将 被 中 断 ， 控 
制 权 会 交 给 其 他 进程 。wait 等 每 于 进程 运行 结束 ， 如 末 不 存在 于 进程 
则 不 做 任何 处 理 。 


系统 调用 wait 主要 有 下 述 3 个 作用 。 


。 通 过 sleep() 中 断 上 自身 的 运行 

。 清理 处 于 僵尸 状态 的 子 进程 

。 寻找 处 于 SSTOP 状态 (参见 第 6 章 ) 的 子 进程 ， 并 解除 该 状态 
wait() 是 系统 调用 wait 的 处 理 函 数 (代码 清单 3-41 ) 。 
代码 清单 3-41 wait() (ken/sys1.a 


1 wait() 

2 

3 register f, *bp; 

4 register struct proc *p; 

5 

6 f = 0; 

7 loop: 

8 for(p = &proc[0]; p < &proc[NPROC]; p++) 
9 if(p->p_ppid == u.u_procp->p_pid) { 

10 f++; 

11 if(p->p_stat == SZOMB) { 

12 u.u_arO[RO] = p->p_pid; 

13 bp = bread(swapdev, f=p->p_addr); 
14 mfree(swapmap, 1, f); 

15 p->p_stat = NULL; 

16 p->p_pid = 0; 

17 p->p_ppid = 0; 

18 p->p_ sig = 0; 

19 p->p_ttyp = 9; 

20 p->p_flag = 0; 

21 p = bp->b_addr; 

22 u.u_cstime[0] =+ p->u_cstime[0]; 
23 dpadd(u.u_cstime, p->u_cstime[1]); 
24 dpadd(u.u_cstime, p->u_stime); 

25 U.Uu_cutime[0] =+ p->u_cutime[0]; 
26 dpadd(u.u_cutime, p->u_cutime[1]); 
27 dpadd(u.u_cutime, p->u_utime); 

28 U.u_arO[R1] = p->u_arg[90]; 


29 brelse(bp); 


30 return 


31 } 

32 if(p->p_stat == SSTOP) { 

33 if((p->p_flag&SWTED) == 0) { 
34 p->p_flag =| SWTED; 

35 u.u_arO[RO] = p->p_pid; 
36 u.u_arO[R1] = (p->p_sig<<8) | 0177; 
37 return; 

38 } 

39 p->p_flag =& ~(STRC |SWTED); 
40 setrun(p); 

41 

42 } 

43 if(f) { 

44 sleep(u.u_procp, PWAIT); 

45 goto loop; 

46 } 

47 U.u_error = ECHILD， 

48 } 


6 ”将 表示 子 进 程 数 量 的 f 清 0。 


8~9 ”遍历 proc[] 寻找 子 进程 。 
10 “递增 子 进 程 的 数量 。 
11~31 ”如 果子 进程 处 于 僵尸 状态 则 进行 下 列 处 理 。 


。 将 用 户 进 程 的 rg 设置 为 子 进程 的 proc ， p- pid ， 并 将 其 作 
， wait 的 返回 值 。 用 户 程序 可 通过 该 值 确认 执行 
完毕 的 子 进程 。 


。 人 空间 的 user 结构 体 中 获得 子 进程 占用 CPU 的 
时 间 。 


。 清除 proc 结构 体 的 各 个 成 员 。 


。 将 用 户 进 程 的 rd 设置 为 子 进程 的 user.u_arg[9]。 用 户 
程序 通过 该 值 可 了 解 子 进程 运行 结束 时 的 状态 。 


最 后 执行 return 。 依 次 清理 处 于 僵尸 状态 的 子 进 程 。 如 果 需 要 
清理 多 个 子 进程 ， 需 要 父 进程 再 次 执行 系统 调用 wait 。 

32~41 ”与 跟踪 相关 的 内 容 会 在 第 6 章 中 介绍 。 

43~46 “如 果 发 现 既 不 处 于 僵尸 状态 ， 也 不 处 于 SSTOP 状态 的 子 
进程 ， 则 进入 睡眠 状态 ， 等 待 该 子 进程 处 理 完毕 。 被 唤醒 后 返回 
loop 再 次 进行 检查 。 


47 “如 采 没 有 发 现 子 进程 则 认为 出 销 。 


3.6 ”数据 区 域 的 扩展 


系统 调用 break 


系统 调用 break 用 来 扩展 或 缩小 数据 段 中 数据 区 域 的 长 度 。 供 用 户 程 
序 调用 的 C 语言 库 函 数 malloc( ) 等 使 用 break 实现 对 堆 区 域 的 扩 
展 等 操作 。 位 于 虚拟 地 址 空间 的 数据 区 域 后 部 的 地 址 被 称 为 break 。 
系统 调用 break 的 用 途 可 以 看 做 是 调整 break 的 位 置 (图 3-20) 。 


虚拟 地 址 空间 


Oxffff 


图 3-20 系统 调用 break 


数据 区 域 的 扩展 和 缩小 通过 expand( ) 进行 。 伴 随 数据 区 域 的 扩展 和 
缩小 ， 栈 区 域 的 位 置 也 会 发 生变 化 。 


sbreak( ) 是 系统 调用 break 的 处 理 函 数 ( 表 3-28， 代 码 清单 3-42 


表 3-28 系统 调用 sbreak 的 参数 


arate tre thre Rt 


代码 清单 3-42 sbreak() (kenm/sys1.c) 


break() 


s 
{ 


register a, 
int 工 ; 


n= (((u.u_arg[0]+63)>>6) & 01777); 
if(!u.u_sep) 
n =- nseg(u.u_tsize) * 128; 
if(n < 0) 
n= 0; 
=n- u.u dsize,; 
n =+ USIZE+U.U_SsSize; 
if(estabur(u.u_tsize, u.u_dsize+d, u.u_ssize, u.u_sep)) 
return; 
uU.u_dsize =+ d 
if(d > 0) 
goto bigger; 
U.u_procp->p_addr + n - Uu.u_ssize; 
nyv 
= U.U_ssize; 
while(n--) { 
copyseg(a-d, a); 
att+; 


} 
expand( 工 ) ; 
return; 


bigger: 
expand(n); 
a = Uu.u_procp->p_addr + n; 
n = Uu.u_ssize; 
while(n--) { 
a--) 
copyseg(a-d, a); 


while(d--) 
clearseg(--a); 


6~12 将 通过 参数 获得 的 以 字 万 为 单位 的 地 址 变 成 以 64 子 太 为 时 位 
的 形式 ， 然 后 减 去 按 页 (以 8KB 为 单位 ) 划分 的 代码 段 的 长 度 ， 


得 到 新 的 数据 区 域 的 长 度 。d 用 于 保存 当前 数据 区 域 和 痢 的 数据 区 
域 的 长 度 差 。n 用 于 保存 新 的 数据 段 全 体 的 长 度 。 


13~14 更 新 用 户 APR， 以 更 新 用 户 空 间 。 
15 ”更 新 通过 user 结构 体 管理 的 数据 区 域 长 度 。 
16~17 ”如 果 是 扩展 数据 区 域 ， 则 跳 转 到 bigger 。 


18~26 ”如 果 是 缩小 数据 区 域 ， 则 将 栈 区 域 向 物理 地 址 的 低位 地 址 
方向 移动 ， 并 执行 expand( ) 删除 剩余 的 部 分 。 


29~37 ”如 采 是 扩展 数据 区 域 ， 则 将 栈 区 域 向 物理 地 址 的 高 位 地 址 
方向 移动 ， 然 后 执行 expand( ) 扩展 数据 段 。 


3.7 管理 内 存 和 交换 空间 

进程 通过 虚拟 地 址 访问 分 配给 自 喘 的 物理 内 存 。 内 核 需 要 为 各 进程 分 
配 物 理 地 址 ， 因 此 必须 对 物理 内 存 中 已 被 使 用 和 尚未 使 用 的 区 域 进行 
管理 。 出 于 同样 的 理由 ， 内 核对 交换 空间 也 需要 进行 管理 。 

本 三 对 内 核 物 理 内 存 和 交换 空间 中 未 使 用 区 域 的 管理 方法 进行 说 明 。 
map 结构 体 

内 核 利 用 map 结构 体 (代码 清单 3-43， 表 3-29 ) 对 物理 内 存 和 交换 空 


间 的 林 全 用 区 域 进行 管理 。map 结构 体 的 成 员 包含 未 使 用 区 域 的 地 址 
和 长 度 。 


代码 清单 3-43 map (ken/malloc.c) 


1 struct map 

2 { 

3 char *m_size; 
4 char *m_addr; 
5 


}; 


表 3-29 map 结构 体 


coremap[] 用 来 管理 物理 内 存 ，swapmap[] 用 来 管理 交换 空间 ( 代 
码 清单 3-44， 表 3-30 ) 。 数 组 元 素 的 排列 顺序 与 地 址 顺序 相同 (图 3- 
) 。 对 物理 内 存 和 交换 空间 的 未 使 用 区 域 采用 同样 的 算法 进行 管 

班 。 


代码 清单 3-44 coremap 和 swapmap (system.h) 


1 nt coremap[CMAPSIZ]; 
2 int swapmap [SMAPSIZ]; 


请 注意 ，coremap[] 和 swapmap[] 分 别 以 64 字 节 和 512 字 节 为 单 
位 管理 未 使 用 的 区 域 。 


表 3-30 coremap[] 和 swapmap[] 


| 对 物理 地 址 进行 管理 


coremapl] 或 物理 内 存 或 地 址 
swapmap!l] 交换 空间 0 


图 3-21 管理 未 使 用 区 域 
coremap[] 和 swapmap[] 于 系统 启动 时 在 main( ) 中 被 初始 化 
( 详 见 第 14 章 ) 。 
获取 未 使 用 区 域 
在 获取 物理 内 存 和 交换 空间 的 未 使 用 区 域 时 采用 了 First Fit 算法 ， 即 从 


寻找 满足 长 度 要 求 并 排 在 最 前 面 的 元 素 (图 
3-22 ) 。 


地 址 ，100 
长 度 写 20 


图 3-22 First Fit 


以 找到 的 未 使 用 区 域 的 起 始 位 置 为 起 点 ， 分 配 所 需 长 度 的 区 域 。 然 后 
增加 该 数组 元 素 的 地 址 值 ， 并 递减 其 长 度 值 ， 使 增加 和 减少 的 长 度 等 
于 新 分 配 区 域 的 长 度 (图 3-23) 。 

长 度 : 15 

未 命中 


地 址 ，20 
长 度 : 10 


地 址 : 100 
长 度 : 20 


地 址 ，100 
长 度 : 20 


地 址 ，20 
长 度 : 10 


图 3-23 命中 


如 果 元 素 的 长 度 和 所 需 长 度 相 同 则 删除 该 元 素 ， 并 将 所 有 余下 的 元 素 
向 前 移动 1 个 位 置 (图 3-24) 。 


长 度 ，30 


命中 

地 址 : 50 地 址 : 100 

长 度 : 30 长 度 : 20 
地 址 ， 20 地 址 : 100 


长 度 : 10 长 度 : 20 


图 3-24 ”向 前 方 移动 


在 数组 有 效 元 素 的 尾部 ， 有 一 个 长 度 为 0 的 元 素 。 当 通过 循环 依次 处 
理 数 组 时 ， 如 有 果 明 见 该 元 素 ， 循 环 将 终止 。 这 个 长 度 为 0 的 元 素 被 称 


为 “哨兵 ”或 “看 守 ”( 图 3-25) 。 
地 址 ，50 
长 度 : 30 
图 3-25 哨兵 


malloc( ) 是 取得 物理 内 存 和 交换 空间 的 函数 ( 表 3-31， 代 码 清单 3- 
45 ) 。 该 男 数 返回 所 取得 区 域 的 地 址 。 取 得 失败 时 返回 0。 


地 址 : 20 
长 度 


XN 
KrF 
己 


表 3-31 malloc0 的 参数 


1 malloc(mp, size) 
2 struct map *mp; 


3 1 

4 register int a; 

5 register struct map *bp; 

6 

7 for (bp = mp; bp->m size; bp++) { 

8 If (bp->m size >= size) { 

9 a = bp->m_addr; 
10 bp->m_addr =+ size; 

11 If ((bp->m_size =- size) == 0) 
12 do { 


13 bp++; 


14 (bp-1)->m_addr = bp->m_addr; 
15 } while ((bp-1)->m_size = bp->m_size); 
16 return(a); 


} 
19 return(0); 


释放 区 域 


mfree( ) 是 用 来 释放 物理 内 存 和 交换 空间 的 函数 ( 表 3-32， 代 码 清单 

3-46 ) 。 从 coremap[]、swapmap[] 的 起 始 位 置 开始 遍历 数组 ， 直 

到 到 达 指 定 地 址 的 要 素 ， 然 后 将 其 返还 至 数组 中 (图 3-26 ) 。 如 果 释 

区 域 的 地 址 相连 ， 则 合并 相关 区 域 
3-27 9 


地 址 : 40 
长 度 : 5 


地 址 : 100 
长 度 : 20 


地 址 : 50 
长 度 : 30 
地 址 :40 
长 度 : 5 


图 3-26 释放 


地 址 ，40 
长 度 : 10 


地 址 ，100 
状 度 ;20 


地 址 : 20 
长 度 : 10 


地 址 ，50 
长 度 : 30 


地 址 : 100 
长 度 : 20 


地 址 : 20 
长 度 : 10 


图 3-27 区 域 的 合并 


表 3-32 ”mfree( 的 参数 


> YD 


参数 


释放 区 域 的 长 度 
-| 卫 让 区 大 的 地 直 


代码 清单 3-46 mfree() (ken/malloc.o) 


1 mfree(mp, size, aa) 
2 Struct map *mp; 


3 4 

4 register struct map *bp; 

5 register int t; 

6 register int a; 

7 

8 a = aa; 

9 for (bp = mp; bp->m addr<=a && bp->m_size!=0; bp++); 
10 if (bp>mp && (bp-1)->m addr+(bp-1)->m_size == a) { 
11 (bp-1)->m_size =+ size; 


12 if (at+size == bp->m addr) { 


13 (bp-1)->m_size =+ bp->m_size; 

14 while (bp->m_ size) { 

15 bp++; 

16 (bp-1)->m_addr = bp->m_addr; 
17 (bp-1)->m_size = bp->m_ size,; 
18 } 

19 } 

20 } else { 

21 if (at+size == bp->m_ addr && bp->m_size) { 
22 bp->m_addr =- size; 

23 bp->m_size =+ size; 

24 } else if (size) do { 

25 t = bp->m_addr; 

26 bp->m_addr = a; 

27 a = t; 

28 t = bp->m_size; 

29 bp->m_size = size; 

30 bp++; 

31 } while (size = t); 

32 } 

33 } 


3.8 小结 
。 系 统 调用 fork 用 来 创建 进程 。 子 程序 可 被 视 作 父 进 程 的 拷贝 
”系统 调用 wait 使 父 进程 在 等 待 子 进程 执行 结束 时 进入 睡眠 状 


态 ， 并 在 闻 济 程 扩 行 结束 后 对 其 进 井 行 清理 


系统 调用 exec 将 程序 执行 文件 读 取 到 内 存 ， 并 构筑 程序 的 执行 
环境 


。 系统 调用 exit 使 进程 进入 伪 尸 状态。 进入 该 状态 的 进程 由 其 父 
进程 清理 


init 进程 负责 对 失去 父 进程 、 处 于 无 所 属 状态 的 进程 进行 清理 


。 执行 进程 中 断后 ， 控 制 权 将 切换 到 具有 更 高 执行 优先 级 ， 并 处 于 
可 执行 状态 的 进程 


。 2 r5、r6、 用 户 APR、 内 核 PAR6 的 值 实现 上 下 文 
3) 


。 利 用 sleep( ) 和 wakeup() 实现 对 资源 的 等 待 处 理 


。 利 用 map 结构 体 ， 并 采用 相同 的 算法 管理 物理 内 存 和 交换 空间 的 
未 使 用 区 域 


。 采用 First Fit 算法 获取 未 使 用 区 域 的 处 理 
。 在 启动 时 对 coremap[] 和 swapmap[] 进行 初始 化 


第 4 章 交换 处 理 


4.1 什么 是 交换 处 理 


执行 程序 时 必须 将 代码 和 数据 读 入 内 存 。 内 存 的 处 理 速 度 很 快 ， 但 容 
。 随 看 进程 数量 的 增多 ， 内 存 将 无 法 容纳 所 有 程序 的 代码 和 数 


因此 ， 内 核 通 过 定期 执行 交换 处 理 ， 将 处 于 休眠 状态 或 执行 优先 级 较 
低 的 进程 从 内 存 移 至 处 理 速度 较 慢 但 容量 较 大 的 磁盘 等 交换 空间 ( 换 
出 ，swap out) ， 当 这 些 进程 成 为 可 执行 状态 时 ， 再 将 其 移 回 内 存 ( 换 
入 ，swap in) 。 通 过 交换 处 理 ,只 有 马上 需要 执行 的 进程 才 会 存在 于 内 
存 中 ,因此 可 以 更 有 效 地 利用 有 限 的 内 存 资源 。 同 时 也 可 以 避免 内 存 容 
量 的 限制 ,以 并 列 方式 执行 更 多 的 进程 (图 4-1) 。 


通过 将 重要 级 别 较 低 的 进程 ee 
换 到 交换 空间 ， 并 将 必要 的 es 
进程 换 入 内 存 ， 可 以 更 有 效 

地 使 用 内 存 


内 存 


容量 小、 高 速 容量 大 、 低 速 
图 4-1 交换 处 理 


代码 段 和 数据 段 


对 进程 进行 换 入 处 理 时 ， 当 代码 段 读 入 到 内 存 后 ， 位 于 交换 空间 内 的 
代码 段 仍 将 保留 。 当 进程 执行 结束 或 被 换 出 内 存 时 ， 如 果 代 码 段 不 再 
被 内 存 中 的 任何 进程 所 参照 ， 则 会 从 内 存 中 被 释放 。 


与 此 相反 ， 对 数据 段 进行 换 入 、 换 出 处 理 时 ,作为 处 理 对 象 的 数据 将 从 
原 有 设备 上 被 释放 (图 4-2) 。 


对 代码 段 而 言 …… 换 入 处 理 从 交换 空间 向 内 存 

复制 数据 
不 再 被 内 存 中 的 任何 
进程 所 参照 时 从 内 存 
中 被 释放 


对 数据 段 而 言 …… 
换 入 、 换 出 处 理 将 伴随 数据 的 移动 
图 4-2 ”代码 段 和 数据 段 


代码 段 与 数据 段 的 不 同 之 处 在 于 ， 代 码 段 数据 是 只 读 的 ， 这 使 交换 空 
间 和 内 存 中 的 数据 总 倚 持 一 致 ， 因 此 系统 对 其 进行 了 上 述 优化 。 


sched() 
sched( ) 也 被 称 作 swapper 函数 ， 用 来 寻找 作为 交换 处 理 对 象 的 进程 


(代码 清单 42 ) ， 由 系统 启动 时 生成 的 进程 proc[9] 定期 调用 。 
0 也 由 proc[9] 调用 ， 因 此 proc[9] 被 称 为 调度 进程 或 调度 


0 0 


。 位 于 交换 空间 的 时 间 最 长 
。 处 于 可 执行 状态 


人 内 存 容 量 不 足 ， 对 满足 下 述 条 件 的 进程 执行 换 
理 。 


。 位 于 内 存 中 
。 处 于 SWAIT 或 SSTOP 状态 


全 则 放宽 条 件 再 次 寻找 作为 换 出 处 理 对 象 
» IT 9° 


。 清 留 内 存 的 时 间 最 长 
。 处 于 SRUN 或 SSLEEP 状态 


但 是 在 这 种 情况 下 ， 作 为 换 入 对 象 的 进程 距 上 次 被 换 出 的 时 间 必 须 大 
于 或 等 于 3 秒 ， 而 作为 换 出 对 象 的 进程 距 上 次 被 换 入 的 时 间 必 须 大 于 
或 等 于 2 秒 。 这 是 为 了 防止 由 于 过 度 的 交换 处 理 ， 导 致 无 法 继续 进行 
原本 的 处 理 的 情况 。 


上 述 处 理 将 反复 执行 ， 直 到 不 再 存在 作为 换 入 或 换 出 对 象 的 进程 (图 
4-3 ) 。 如 果 处 理 结束 时 不 再 存在 可 作为 换 入 对 象 的 进程 ，runout 标 
志 变 量 会 被 设置 为 大 于 0 的 值 。 如 果 不 再 存在 可 作为 换 出 对 象 的 进 
电 runin 标志 变量 会 被 设置 为 大 于 0 的 值 (代码 清单 4-1， 表 4-1 


procl] 交换 空间 


中 在 位 于 交换 空间 的 进程 中 寻找 处 
于 可 执行 状态 、 被 移出 内 存 时 间 


2) 如 果 在 进行 换 入 处 理 时 内 存 
空间 不 足 ， 就 从 满足 条 件 的 
进程 中 选择 1 个 将 其 换 出 内 


一 看 , 并 返回 到 4 
对 象 


1. 处 于 SWAIT 或 SSTOP 状态 

2. 处 于 SRUN 或 SSLEEP 状态 ， 并 在 内 存 中 停留 时 间 最 长 的 进程 
但 是 需要 满足 下 列 条 件 
e 换 入 对 象 位 于 交换 空间 的 时 间 大 于 或 等 于 3 秒 
e 换 出 对 象 位 于 内 存 的 时 间 大 于 或 等 于 2 秒 


图 4-3 sched0) 
代码 清单 4-1 runin 和 runout (system.h) 


1 char runin; 
2 char runout,; 


表 4-1 sched0 的 结束 标志 


不 存在 可 作为 换 入 对 象 的 进程 


| 


不 存在 可 作为 换 出 对 象 的 进程 


代码 清单 4-2 sched() (sys/slp.o) 


1 

2 

3 struct proc *p1; 

4 register struct proc *rp; 

5 register a, n; 

6 

7 goto loop; 

8 

9 sloop: 
10 runIn++， 
11 sleep(&runin, PSWP); 
12 
13 loop: 
14 /* 寻找 作为 换 入 对 象 的 进程 */ 
15 sp16( ); 
16 n = -1; 
17 for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 
18 if(rp->p_stat==SRUN && (rp->p_flag&SLOAD)==0 && 
19 rp->p_time > n) { 
20 pi = rp; 
21 n = rp->p_time; 
22 } 
23 if(n == -1) { 
24 runout++; 
25 sleep(&runout, PSWP); 
26 goto loop; 
27 } 
28 
29 spl10(); 
30 rp = pi1; 
31 a = rp->p_size; 
32 if((rp=rp->p_textp) != NULL) 
33 if(rp->x_ccount == 0) 
34 a =+ rp->x_size,; 
35 if((a=malloc(coremap, a)) != NULL) 
36 goto found2; 
37 


38 /* 寻找 处 于 SWAIT 或 SSTOP 状 态 的 进程 作为 换 出 对 象 */ 


39 sp16( ); 


40 for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 
41 if((rp->p_flag&(SSYS|SLOCK|SLOAD))==SLOAD && 
42 (rp->p_stat == SWAIT || rp->p_stat==SSTOP)) 
43 goto found1; 

44 

45  ”/* 寻找 在 内 存 中 停留 时 间 最 长 的 进程 作为 换 出 对 象 */ 

46 if(n < 3) 

47 goto sloop; 

48 n = -1; 

49 for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 
50 if((rp->p_flag&(SSYS|SLOCK|SLOAD))==SLOAD && 
51 (rp->p_stat==SRUN || rp->p_stat==SSLEEP) && 
52 rp->p_time > n) { 

53 pi = rp; 

4 n = rp->p_time; 

55 } 

56 if(n < 2) 

57 goto sloop; 

58 rp = pi1; 

59 

60 found1: 

61 /* 换 出 处 理 */ 

62 spl10(); 

63 rp->p_flag =& ~SLOAD; 

64 xswap(rp, 1, 0); 

65 goto loop; 

66 

67 found2: 

68 /* 换 入 处 理 */ 

69 if((rp=p1i->p_textp) != NULL) { 

70 if(rp->x_ccount == 0) { 

?1 if(swap(rp->x_daddr, a, rp->x_size, B_READ)) 
72 goto swaper; 

73 rp->x_caddr = a; 

74 a =+ rp->x_size,; 

75 } 

76 rp->x_ccount++; 

77 } 

78 rp = pl; 

79 if(swap(rp->p_addr, a, rp->p_size, B_READ)) 
80 goto swaper; 

81 mfree(swapmap, (rp->p_size+7)/8, rp->p_addr); 
82 rp->p_addr = a; 

83 rp->p_flag =| SLOAD; 

84 rp->p_time = 0; 

85 goto loop; 

86 

87 swaper: 

88 panic("swap error"); 


89 } 


| 


9~11 不 存在 换 出 对 象 时 的 处 理 。 设 置 runin 标志 变量 后 进入 睡 
眼 状态 。 被 唤醒 后 ， 从 寻找 换 入 对 象 进程 处 继续 进行 交换 处 理 。 


15 ”将 处 理 器 优先 级 设置 为 6， 防 止 发 生 中 断 。 这 是 为 了 避免 代 
表 在 内 存 或 交换 空间 内 生存 时 间 的 proc.p_time 因为 时 钟 中 断 
而 发 生 改 变 。 关 于 中 断 和 处 理 器 优先 级 ， 请 参照 第 5 章 的 内 容 。 


16~27 ”在 处 于 可 执行 状态 (SRUN ) 并 且 处 于 被 换 出 状态 
(1!1SLOAD ) 的 进程 中 ， 寻 找 在 交换 空间 中 停留 时 间 最 长 
(proc.p_time 具有 最 大 值 ) 的 进程 。 如 果 不 存 在 满足 条 件 的 进 
程 ， 则 在 设置 runout 标志 变量 后 进入 睡眠 状态 。 


32~34 ”如 果 换 入 进程 使 用 的 代码 段 在 内 存 中 不 存在 ， 说 明 其 代码 
段 也 需要 被 换 入 内 存 ， 因 此 需要 增加 分 配给 进程 的 内 存 ， 增 加 的 
长 度 为 代码 段 的 长 度 。 


35~36 ”执行 malloc( ) 分 配 换 入 进程 使 用 的 内 存 。 如 果 分 配 成 
功 ， 则 跳 转 至 found2 。 


39~43 ”如 果 内 存 空间 不 足 ， 需 要 将 相对 不 重要 的 进程 换 出 至 交换 
空间 。 首 先 寻 找 存 在 于 内 存 之 中 (SLOAD ) 、 既 不 处 于 交换 处 理 
(1SLOCK ) 也 不 是 系统 进程 (!1SSYS ) 的 进程 。 该 进程 还 必须 
满足 下 述 条 件 。 优 先 级 大 于 等 于 0， 处 于 睡眠 状态 (SWAIT ) 或 

者 因 跟 踪 处 理 处 于 停止 状态 (SSTOP ) 。 如 果 找 到 满足 上 壕 条 件 

的 进程 ， 则 跳 转 至 found1 。 


46~58 “如 有 条 没有 找到 满足 条 件 的 进程 ， 则 放宽 进 行 换 出 处 理 的 条 
件 。 但 是 ， 如 果 作 为 换 入 对 象 的 进程 距 上 次 换 出 的 时 间 小 于 3 
秒 ， 设 置 runin 标志 变量 后 会 进入 睡眠 状态 。 


寻找 处 于 睡眠 状态 (SSLEEP ， 此 时 优先 级 为 负 值 ) 或 可 执行 状态 
(SRUN ) ， 并 且 清 留 内 存 时 间 最 长 (proc.p_time 具有 最 大 
值 ) 的 进程 。 但 是 ， 如 果 该 进程 距 上 次 换 入 的 时 间 小 于 2 秒 ， 设 
置 runin 标志 变量 后 会 进入 睡眠 状态 。 


62~65 ”执行 换 出 处 理 。 在 清除 换 出 对 象 进 程 的 SLOAD 标志 位 之 
后 ， 调 用 xswap( ) 进行 换 出 处 理 。 该 函数 的 第 2 个 参数 设 定 为 
1， 表 示 将 从 内 存 中 释放 对 象 进程 。 换 出 处 理 结束 后 ， 返 回 1oop 
并 再 次 选择 作为 换 入 对 象 的 进程 。 


67~85 ”执行 进程 的 换 入 处 理 。 首 先 换 入 代码 段 ， 如 果 进 程 所 需 的 
代码 段 在 内 存 中 不 存在 ， 则 调用 swap( ) 将 其 换 入 内 存 。 关 于 
swap( ) 的 详细 介绍 请 见 第 7 章 。 换 入 处 理 结束 后 ， 用 代码 段 的 物 
理 地 址 设置 text[] 中 代表 该 代码 段 的 元 素 ， 同 时 递增 参照 计数 
器 以 反映 内 存 中 的 进程 对 代码 段 的 参照 次 数 。 然 后 换 入 数据 段 。 
执行 swap( ) 进行 换 入 处 理 。 释 放 位 于 交换 空间 的 数据 段 ， 更 新 
el 元 素 后 运 回 1oop ， 再 次 寻找 是 否 还 存在 其 他 的 换 入 对 


xswap() 


xswap( ) 是 用 来 对 进程 的 数据 段 进行 换 出 处 理 的 函数 ( 表 4-2， 代 码 
清单 4-3 ) 。 通 过 参数 可 以 指定 被 换 出 的 数据 段 是 否 需 要 从 内 存 中 释 
放 。 如 果 需 要 释放 ， 则 将 被 换 出 的 数据 段 从 内 存 移动 至 交换 空间 。 如 
果 不 需 要 释放 ， 则 将 其 从 内 存 复制 到 交换 空间 。newproc( ) 使 用 
xswap( ) 的 从 内 存 复 制 到 交换 空间 的 功能 (图 4-4) 。 


交换 空间 


内 存 


xswap!) 


是 否 释放 
内 存 由 函 
数 的 参数 


决定 通过 malloc() 分 配 


图 4-4 xswap() 


表 4-2 ”xswap() 的 参数 


位 ) ， 如 引 吏 用 proc.p_size 


oOS ) 


register *rp, a; 


rp = Pp; 
if(os == 0) 
os = rp->p_size; 
a = malloc(swapmap, (rp->p_size+7)/8); 
if(a == NULL) 
panic("out of swap space"); 
xccdec(rp->p_textp); 
rp->p_flag =| SLOCK; 
if(swap(a, rp->p_addr, os, 0)) 
panic("swap error"); 
if(ff) 
mfree(coremap, os, rp->p_addr); 
rp->p_addr = a; 
rp->p_flag =& ~(SLOAD|SLOCK); 
rp->p_time = 0; 
if(runout) { 
runout = 0; 
wakeup(&runout ) ; 


7-8 如果 第 3 个 参数 os 的 值 为 0， 将 其 设置 为 换 出 对 象 进程 的 
数据 段 的 长 度 。 


9~11 ”分 配 交换 空间 。malloc( ) 返回 交换 磁盘 的 块 编 号 。 

12 ”执行 xccdec() ， 递 减 换 出 对 象 进程 所 参照 的 代码 段 的 参照 
计数 器 ， 该 计数 器 反映 内 存 中 的 进程 对 此 代码 段 的 参照 次 数 。 
设置 换 出 对 象 进程 的 SLOCK 标志 位 (表示 处 于 交换 处 理 
ER 


14~15 ”执行 swap( ) 进行 换 出 处 理 。 


16~17 ”如 果 第 2 个 参数 ff 不 为 0， 则 从 内 存 中 释放 换 出 对 象 进 
程 的 数据 段 。 


18~20 ”将 换 出 的 对 象 进程 的 数据 段 的 地 址 换 成 为 其 分 配 的 交换 空 
间 的 地 址 〈 块 编号 ) 。 清 除 SLOAD 和 SLOCK 标志 位 ， 并 将 在 交 
换 空 间 内 表示 淆 留 时 间 的 proc.p_time 清 0。 


21~24 “如果 设 置 了 runout 标志 变量 (表示 不 存在 可 换 入 的 进 
程 ) ， 则 会 启动 调度 器 。 


4.2 ”共享 代码 段 的 处 理 


代码 段 是 用 来 容纳 程序 指令 的 只 读 区 域 。 因 为 指令 不 会 发 生变 化 ， 所 
以 如 果 某 个 程序 同时 存在 多 个 运行 中 的 进程 ， 这 些 进 程 将 共享 同一 个 
代码 段 。 通 过 这 种 方式 可 以 节约 内 存 的 使 用 量 。 


代码 段 通过 text 结构 体 的 数组 text[] 进行 管理 (代码 清单 44， 代 
码 清单 4-5， 表 4-3 ) 。text[] 的 每 个 元 素 分 别 对 应 一 个 代码 段 。 各 
个 进程 所 使 用 的 text[] 元 素 由 proc,p_textp 设 定 。 在 多 个 进程 共 
享 代码 段 时 ， 这 些 进程 将 指向 text[] 的 同一 个 元 素 。 代 码 段 的 长 度 
由 user.u_tsize 表示 (图 4-5) 。 


text[] 元 素 持 有 指向 inode[] 中 对 应 程序 执行 文件 的 元 素 指针 。 内 
核 通 过 此 处 的 设 定 来 判断 是 否 存在 多 个 进程 试图 运行 同一 个 程序 。 如 


果 程序 执行 文件 作为 代码 段 使 用 ， 那 么 将 设置 inode[] 中 对 应 该 文件 
元 素 的 ITEXT 标志 位 。 关 于 inode[] 将 在 第 9 章 进行 详细 介绍 。 


代码 清单 4-4 text[] (text.h) 


truct text 


int x_daddr; 
int x_caddr; 
int x_Ssize; 


int *x_iptr; 

char x_count; 

char x_ccount; 
} text[NTEXT]; 


代码 清单 4-5 NTEXT (param.h) 


1 #define NTEXT 40 


表 4-3 text 结构 体 


3 = 
区 换 磁盘 中 的 地 址 (1 个 块 =512 字 市 ) 

读 入 内 存 时 的 物理 内 存 地 址 〈 以 64 字 节 为 单 他 
代码 段 的 长 度 《以 64 字 节 为 单 人 
指向 inode[] 中 对 应 程序 执行 文件 的 元 素 


以 所 有 进程 为 对 象 的 参照 计数 器 


以 内 存 中 的 进程 为 对 象 的 参照 计数 器 


proc[] 人 text[] 代码 段 


图 4-5 进程 间 共 享 代码 段 

当 内 存 中 的 所 有 进程 不 再 参照 某 个 代码 段 时 ， 该 代码 段 将 从 内 存 中 被 
释放 。 当 所 有 进程 不 再 参照 text[] 的 某 个 元 素 时 ， 此 元 素 对 应 的 代 
码 段 将 从 交换 空间 中 被 释放 ， 同 时 该 元 素 也 将 被 释放 。 为 了 区 分 上 壕 
两 种 情况 ，text 结构 体 拥 有 两 种 参照 计数 器 ， 分 别 是 以 所 有 进程 为 对 
象 的 参照 计数 器 x_count ， 以 及 以 内 存 中 的 进程 为 对 象 的 参照 计数 器 


x_ccount 。 

创建 新 的 代码 段 时 ， 需 要 按照 下 述 步 骤 进 行 操 作 〈 图 4-6) 。 
1. 取得 text[] 元 素 。 

2. 读 取 程序 的 指令 并 暂时 保存 到 进程 的 数据 区 域 。 

3. 对 数据 段 进行 换 出 处 理 ， 并 释放 内 存 中 的 数据 段 。 


4. 调度 器 (proc[9] ) 将 该 进程 换 入 内 存 ， 并 将 数据 段 中 的 指令 作为 
代码 段 配置 到 进程 的 虚拟 地 址 空间 中 。 


如 有 果 所 需 的 代码 段 已 经 位 于 内 存 之 中 ， 则 省 略 上 述 处 理 。 


如 果 所 需 的 代码 段位 于 交换 空间 中 ， 则 省 略 上 述 1~3 的 处 理 。 如 果 
inode[] 中 设置 了 对 应 程序 执行 文件 元 素 的 Sticky Bit ( 即 设置 了 
inode.i_mode 的 ISVTX 标志 位 ) ,即使 代码 段 没 有 被 任何 进程 参照 
也 不 会 从 交换 空间 释放 。Shell 等 使 用 频率 较 高 的 程序 通常 会 设置 
Sticky Bit， 这 样 可 以 通过 省 略 上 述 1~3 的 处 理 改善 程序 的 启动 速度 。 


磁盘 内 存 


交换 空间 


数据 段 
( 临时 ) 


换 入 
by proc[0O] 


图 4-6 代码 段 的 创建 
xalloc() 


xalloc( ) 将 代码 段 分 配给 执行 进程 ( 表 4-4， 代 码 清单 4-6 ) 。 该 函 
数 只 被 exec( ) 调用 。 


xalloc() 从 text[] 中 寻找 未 使 用 的 元 素 ， 同 时 检查 所 需 代 码 段 是 
否 已 经 存在 于 text[] 中 。 如 果 已 经 存在 , 则 将 该 元 素 分 配给 进程 。 


如 果 所 需 的 代码 段 在 text[] 中 不 存在 ， 且 text[] 中 存在 未 使 用 的 
元 素 时 ， 将 该 元 素 分 配给 进程 。 在 将 程序 的 指令 读 取 到 数据 段 后 ， 将 
数据 段 换 出 至 交换 空间 。 对 inodef[] 中 对 应 程序 执行 文件 的 元 素 设 置 
ITEXT 标志 位 ， 将 其 标明 为 代码 段 ， 然 后 递增 该 jnode[] 元 素 的 参 
照 计数 器 。 代 码 段 的 换 入 处 理由 sched[] 进行 。 


表 4-4 xalloc() 的 参数 


程序 执行 文件 的 元 素 


1 xalloc(ip) 
2 int *ip; 


3 { 


register Struct text *xp; 
register *rp, ts; 


if(u.u_arg[1] == 0) 
return; 
rp = NULL; 
for(xp = &text[0]; xp < &text[NTEXT]; xp++) 
if(xp->x_iptr == NULL) { 
if(rp == NULL) 
rp = xp; 
} else 
if(xp->x_iptr == ip) { 
xp->x_count++; 
U,U_procp->p_textp = xp; 
goto out ; 


} 
if((xp=rp) == NULL) 
panic("out of text"); 
xp->x_count = 1; 
xp->x_ccount = 0; 
xp->x_iptr = ip; 
ts = ((u.u_arg[1]+63)>>6) & 01777; 
xp->x_size = ts; 
if((xp->x_daddr = malloc(swapmap, (ts+7)/8)) == NULL) 
panic("out of swap space"); 
expand(USIZE+ts ); 
estabur(0, ts, 0, 0); 
U.Uu_count = u.u_arg[1]; 
u.u_offset[1] = 020; 
U.U_base = 0，; 
readi(1ip); 
rp = u.u_procp; 
rp->p_flag =| SLOCK; 


37 swap(xp->x_daddr, rp->p_addr+USIZE, ts, 0); 


38 rp->p_flag =& ~SLOCK; 

39 rp->p_textp = xp; 

40 rp = ip; 

41 rp->i_flag =| ITEXT， 

42 rp->i_count++; 

43 expand (USIZE); 

44 

45 out: 

46 if(xp->x_ccount == 0) { 

47 savu(u.u_rsav); 

48 savu(u.u_ssav); 

49 xswap(u.u_procp, 1, 0); 
50 uU,.U_procp->p_flag =| SSWAP; 
51 swtch( ); 

52 

53 xp->x_ccount++; 

54 } 


7~8 ”代码 段 的 长 度 为 0 时 不 做 任何 处 理 。u.,u_arg[1] 由 
exec( ) 设置 为 程序 执行 文件 的 代码 长 度 (以 字 市 为 单位 ) 。 


9~21 在 text[] 中 寻找 未 使 用 元 素 。 如 果 所 需 的 代码 段 已 存在 
于 text[] 中 ， 将 该 代码 段 的 参照 计数 器 加 1， 并 将 执行 进程 指 问 
该 text[] 元 素 。 


22~26 ”对 取得 的 text[] 元 素 进 行 初 始 化 。 
27~28 ”分 配 交换 空间 。malloc( ) 返回 交换 磁盘 的 块 编号 。 


29~30 ”为 了 将 程序 的 指令 读 取 至 数据 区 域 ,执行 expand( )、 
estabur() 更 新 用 户 空 间 。 以 用 户 空 间 的 地 址 0 为 起 点 ， 分 配 与 
程序 文件 代码 数据 相同 长 度 的 内 存 作 为 数据 区 域 。 


31~34 “将 代码 段 配置 于 虚拟 地 址 0 的 位 置 。u.u_offset[1] = 
020 表示 跳 过 程序 执行 文件 的 文件 头 。 


36~38 ”执行 swap() ， 将 〈 容 纳 着 代码 数据 的 ) 数据 段 换 出 内 
存 。 在 进行 交换 处 理 的 过 程 中 保持 已 设置 SLOCK 标志 位 的 状态 。 


39~42 ”将 textf[] 元 素 分 配给 进程 ， 并 设置 与 代码 段 相 对 应 的 
inode[] 元 素 的 参数 。 


43 ”执行 expand() ， 将 数据 段 压 缩 至 最 小 长 度 。 


45~52 “如果 没有 任何 内 存 中 的 进程 参照 程序 文件 的 代码 数据 ， 则 
将 进程 〈 数 据 段 ) 暂时 换 出 内 存 。 此 时 ， 数 据 段 中 只 包含 最 低 限 
度 的 数据 (PPDA) 。 人 然后 执行 swtch( ) 切换 执行 进程 。 当 进程 
再 次 执行 时 ， 从 退出 xalloc( ) 的 位 置 开始 继续 处 理 。 


53 ”将 代码 段 参照 计数 器 加 1， 该 计数 器 表示 内 存 中 的 进程 对 代 
码 段 的 参照 数量 。 


xfreel() 


xfree( ) 用 来 递减 执行 进程 使 用 的 代码 段 的 参照 计数 器 (代码 清单 4- 
7) ， 包 括 以 内 存 中 的 进程 为 对 象 的 计数 器 ， 和 以 所 有 进程 为 对 象 的 
计数 器 。 当 后 者 的 值 为 0 时 ,执行 mfree() 释放 位 于 交换 空间 的 代码 
段 ,并 释放 text[] 中 相应 的 元 素 。 但 是 ， 当 与 代码 段 相 对 应 的 
inode[] 元 素 的 ISVTX 标志 位 (Sticky Bit) 被 设置 时 ， 不 进行 上 述 
的 释放 人 处理。 


代码 清单 4-7 xfree0 (ken/text.c) 


1 xfree() 

2 

3 register *xp, *ip; 

4 

5 if((xp=u.u_procp->p_textp) != NULL) { 
6 u.u_procp->p_textp = NULL; 

7 xccdec(xp); 

8 if(--xp->x_count == 0) { 

9 ip = xp->x_iptr; 

10 if((ip->i mode&ISVTX) == 0) { 
11 xp->x_iptr = NULL; 

12 mfree( swapmap, (xp- >x_size+7)/8, xp->x_daddr); 
13 ip->i_flag =& ~ITEXT; 

14 iput (ip); 

15 } 

16 } 


18 } 


5 ”如 果 执 行进 程 没 有 使 用 代码 段 ， 则 不 做 任何 处 理 。 
7 ”执行 xccdec() ， 递 减 以 内 存 中 的 进程 为 对 象 的 的 代码 段 参 
照 计数 器 。 

xccdecl() 


xccdec( ) 用 来 递减 以 内 存 中 的 进程 为 对 象 的 代码 段 参 照 计 数 器 ( 表 
4-5， 代 码 清单 4-8 ) 。 当 参照 计数 器 为 0 时 ， 执 行 mfree( ) 以 释放 内 
存 中 的 代码 段 。 


表 4-5 xccdec( 的 参数 


代码 清单 4-8 xccdec() (sys/text.c) 


1 xccdec(xp) 
2 int *xp; 
3 1 


register *rp; 


if((rp=xp)!=NULL && rp->x_ccount!=0) 


if(--rp->x_ccount == 0) 
mfree(coremap, rp->x_size, rp->x_caddr); 


4.3 ”小结 


通过 交换 处 理 和 共享 代码 段 可 以 有 效 利用 有 限 的 内 存 。 


proc[9] 定期 进行 交换 处 理 。proc[0] 被 称 为 调度 进程 或 调度 
器 O 


每 一 次 交换 处 理 都 会 持续 至 不 再 存在 可 交换 对 象 为 止 。 

代码 段 在 被 读 取 至 内 存 时 ， 在 交换 空间 中 也 会 保留 一 份 相 同 的 数 
0 0 
代码 段 拥 有 两 个 参照 计数 万 。 

如 有 条 代 码 段 不 再 被 内 存 中 的 任何 进程 参照 ， 将 从 内 存 中 被 释放 。 
如 末代 码 段 不 再 被 任何 进程 参照 ， 将 从 交换 空间 中 被 释放 。 


如 条 设 定 了 Sticky Bit， 则 不 会 从 交换 空间 中 释放 代码 段 。 这 样 可 
以 加 快 启动 速度 。 


。 代码 段 首 先 在 交换 空间 中 生成 ， 随 后 被 读 取 至 内 存 。 


第 III 部 分 ”中断 


周边 设备 发 出 的 请 求 以 及 CPU 内 部 特定 的 事件 ,以 中 断 或 陷入 的 形式 加 
以 处 理 。 执 行 中 的 进程 将 暂停 运行 , 转 而 处 理发 生 的 中 断 或 陷入 。 待 处 
理 完成 后 ,被 暂 俘 的 进程 再 次 恢复 运行 。 此 外 ,系统 调用 也 是 通过 陷入 的 
机 制 加 以 实现 的 。 第 II 部 分 主要 对 以 下 内 容 进 行 介绍 。 

。 与 中 断 相 对 应 的 处 理 是 如 何 被 调用 的 

。 执行 中 的 进程 是 如 何 暂停 运行 ,又 是 如 何 被 恢复 的 


。 系统 调用 是 如 何 实现 的 


通过 阅读 本 部 分 的 内 容 ,对 实现 高 效 处 理 CPU 内 外 发 生 事件 的 方法 应 该 
会 有 比较 清晰 的 理解 。 


第 5 章 ”中断 与 陷入 


5.1 什么 是 中 断 与 陷入 
什么 是 中 断 

中 断 是 指 用 来 实现 下 述 处 理 的 机 制 : 当 周 边 设备 发 出 请 求 时 ， 和 暂停 执 
行 中 的 进程 ， 转 而 执行 与 请 求 相对 应 的 处 理 。 待 处 理 完成 后 再 恢复 被 
暂停 的 进程 。 对 中 断 请 求 进行 处 理 的 画 数 被 称 为 中 断 处 理 画 数 。 

中 断 请 求 包括 下 述 几 种 类 型 。 

。 块 设备 处 理 完成 通知 

。 终端 输入 

。 时 钟 中 断 
通过 中 断 能 够 实现 如 下 功能 。 比 如 ， 当 某 进 程 在 向 块 设备 提出 处 理 请 
求 后 ， 在 等 待 设备 处 理 完成 之 前 ,系统 可 以 先 处 理 其 他 进程 (图 5-1 
) 。 如 果 没 有 中 断 的 机 制 ， 提 出 请 求 的 进程 必须 定期 检查 设备 是 否 发 


出 了 处 理 结束 的 通知 。 这 种 方式 被 称 为 轮 询 。 与 处 理 喜 相 比 ， 周 边 设 
人 


由 此 可 知 ， 中 断 是 一 种 对 进程 运行 和 异步 事件 进行 高 效 处 理 的 机 制 。 


进程 1 进程 2 时 间 


;Sleep() 

; SSLEEP 
变 成 内 核 进程 ， 
进行 与 中 断 相 对 
应 的 处 理 
WakeupI() 


由 于 硬件 处 理 结束 后 将 发 生 中 断 ， 因 此 可 以 先 处 理 其 他 进程 
图 5-1 中 断 


磁盘 设备 进程 1 进程 2 时 间 


届 
烂 
岂 


硬件 的 处 理 是 否 已 经 结束 


图 5-2 轮 询 


中 断 处 理 函 数 由 内 核 进程 负责 执行 。 在 运行 用 户 进程 时 发 生 中 断 的 
话 ， 则 通过 便 件 切换 至 内 核 进程 。 


被 中 断 的 进程 的 数据 暂 存 于 内 核 栈 之 中 。 当 中 断 处 理 函 数 结束 后 ， 将 
恢复 内 核 栈 中 的 数据 ， 并 继续 处 理 被 中 断 的 进程 。 


什么 是 陷入 


陷入 与 前 述 的 中 断 一 样 ， 会 引起 执行 进程 的 暂停 和 恢复 处 理 。 与 中 断 
的 不 同 之 处 在 于 ， 陷 入 是 由 CPU 内 部 的 事件 引起 的 。 


当 程 序 执行 中 发 生 异 常 时 ， 会 设置 PSW 的 陷入 位 (PSW[4]) ， 表 示 陷 
入 被 触发 。 异 常 包 括 以 下 情况 。 

。 被 0 除 

。 访 问 了 未 被 分 配 的 区 域 

。 总 线 超时 

因为 存在 陷入 机 制 ,所 以 用 户 程 序 不 必 每 次 都 确认 异常 情况 ,或 逐一 处 理 
。 当 异常 出 现时 会 触发 陷入 ， 并 自动 执行 共用 的 处 理 。 当 某 种 陷入 发 
生 时 ， 如 果 希 望 在 对 其 进行 适当 处 理 后 继续 原来 的 操作 ， 可 以 定义 独 
自 的 陷入 处 理 函 数 来 实现 。 

由 内 核 进 程 触 发 的 陷入 ， 通 常 应 由 独自 定义 的 陷入 处 理 函 数 处 理 。 内 
核 程 序 在 执行 可 能 会 触发 陷入 的 指令 前 ， 将 变量 nofault 设 定 为 与 此 
陷入 相对 应 的 处 理 函 数 的 地 址 。 当 陷入 发 生 时 ，nofault 指向 的 处 理 
函数 将 自动 执行 。 


用 户 程序 触发 的 陷入 最 终 作 为 信号 被 处 理 (参见 第 6 章 ) 。 通 过 对 信 
号 设 定 处 理 画 数 ， 在 异常 发 生 时 可 以 进行 独 目 处 理 。 


什么 是 系统 调用 


前 面 已 经 讲 过 ， 用 户 程序 通过 系统 调用 的 机 制 ， 访 问 内 核 提供 的 各 各 
功能 


由 于 用 户 程序 不 能 直接 操作 内 核 的 功能 ， 因 此 具有 下 述 优点 。 


。 人 意 执行 了 可 能 会 对 系统 造成 危害 的 
日 六 


。 用 户 程序 无 须 了 解 内 核 内 部 进行 的 复杂 处 理 


当 用 户 程序 执行 系统 调用 后 ， 内 核 进程 会 进行 相应 的 处 理 。 从 用 户 进 
程 切换 到 内 核 进程 并 进行 相应 处 理 的 过 程 ,都 是 利用 陷入 实现 的 。 


用 户 程序 执行 汇编 器 的 sys 指令 后 会 触发 表示 系统 调用 的 陷入 。 系 统 
调用 存在 多 种 类 型 ， 通 过 sys 指令 的 第 1 个 参数 指定 。 有 的 系统 调用 
还 带 有 上 自己 的 参数 。 参 数 的 指定 方法 因 系统 调用 种 类 的 不 同 而 不 同 , 具 
体 请 参考 UPM (2) 的 说 明 。 


sys 指令 为 汇编 器 的 模拟 指令 ，PDP-11/40 中 实际 触发 陷入 的 指令 为 
trap 。trap 指令 的 低位 比特 含有 表示 陷入 种 类 的 值 。 汇 编 右 将 Sys 
指令 和 第 1 个 参数 ， 编 码 为 trap 指令 。 


5.2 ”优先 级 与 回 量 (Vector) 
中 断 优 先 级 和 处 理 器 优先 级 


中 断 中 含有 从 0 到 7 的 中 断 优 先 级 。 当 PSW 中 的 处 理 器 优先 级 
(PSW[7-5]) 大 于 或 等 于 中 断 优先 级 时 ,该 中 断 不 会 被 处 理 。 周 边 设备 
。 中 断 请 求 ， 直 到 处 理 器 优先 级 下 降 ， 该 中 断 得 到 处 理 为 目 
5-3) 。 


周边 设备 1 周边 设备 2 | 执行 进程 
' ' | 处理 器 优先 级 5 
新 优先 级 5 |! 
1 中 断 优 先 级 5 ， 不 做 处 理 
持续 发 出 | ' 
| 中 断 优先 级 6 
一 一 一 一 > 进行 处 
| 处理 器 优先 级 4 
| + 进行 处 理 
图 5-3 ”中断 的 掩 码 


Ce 
5-]) 。 


代码 清单 5-1 spln0 (conf/m40.s) 


1 .globl _sSpl0, _spl1i, _spl4, _spl5, _spl6, _sp17 
2 _Sp10: 

3 bic $340, PS 
4 rts pc 

5 

6 _Sp1l1: 

7 bis $40,PS 
8 bic $300, PS 
9 rts pc 

10 

11 _spl14: 

12 _Sp15: 

13 bis $340, PS 
14 bic $100, PS 
15 rts pc 

16 

17 _spl6: 


18 bis $340, PS 


19 bic $40,PS 


20 rts pc 

21 

22 _spl7 

23 bis $340, PS 
24 rts pc 


执行 中 断 处 理 函 数 时 处 理 器 优先 级 被 设置 为 中 断 优 先 级 的 值 ， 在 处 理 
过 程 中 也 可 以 提高 处 理 器 优先 级 。 但 是 用 小 于 中 断 优 先 级 的 处 理 器 优 
先 级 执行 中 断 处 理 函 数 会 导致 一 些 问 题 。 在 运行 中 断 处 理 函 数 时 ， 如 
末 再 次 收 到 相同 类 型 的 中 断 请 求 ， 中 断 与 由 中 断 处 理 引 起 的 副作用 在 
发 生 的 顺序 上 会 出 现 逆 转 。 比 如 说 ， 在 终端 里 输入 文字 列 后 ， 文 字 列 
会 按照 与 输入 时 不 同 的 顺序 显示 (图 5-4) 。 


执行 进程 中 断 1 的 处 理 中 断 2 的 处 理 
中 断 1 发 生 


中 断 2 发 生 


由 中 断 2 引起 的 
副作用 


由 中 断 1 引 起 的 
副作用 


中 断 的 发 生 顺 序 为 1 一 2， 而 终端 副作用 的 顺序 为 2 一 1 


图 5-4 ”中断 处 理 的 顺序 发 生 逆 转 


陷入 的 优先 级 相当 于 中 断 优先 级 的 8。 无 论 当 前 处 理 器 优先 级 的 值 是 多 
少 , 当 陷 入 发 生 时 都 会 马上 得 到 处 理 。 


中 断 和 陷入 同 量 

中 断 和 陷入 拥有 相应 的 中 断 和 陷入 向 量 。 中 断 和 陷入 向 量 是 一 些 预 设 
的 PSW 值 和 pc 值 的 存放 地 址 ,内 核 进程 在 开始 处 理 中 断 和 陷入 时 会 使 用 
这 些 预 设 值 来 设置 PSW 和 pc 寄存 器 。 


具有 代表 性 的 中 断 和 陷入 回 量 如 表 5-1、 表 5-2 所 示 。 表 5-1 同时 显示 
了 用 盯 优 需 肥 。 


表 5-1 中 断 向 量 


源 频 率 时 钟 0100 


表 5-2 ”陷入 向 量 


i 


rm 
rr 


模拟 陷入 指令 


sys(trap) 指 令 


浮动 小 数 点 错误 


5.3 “中断 和 陷入 的 处 理 流程 

中 断 和 陷入 由 发 生 到 处 理 结束 基本 遵循 相同 的 处 理 流 程 (图 5-5) 。 
1. 发 生 中 断 或 陷入 

2. 将 当前 的 PSW 与 pc 保存 于 内 核 栈 

3. 从 向 量 指定 的 地 址 读 取 PSW 和 pc 

4. 执行 call 或 trap 


5. 执行 中 断 处 理 函 数 或 陷入 处 理 函 数 
6. 从 内 核 栈 中 恢复 PSW 和 pc 


周边 设备 内 部 事件 执行 进程 内 核 进程 
| , 向 量 所 示 地 址 
,要 1 |PSw 
中 断 、 陷 入 | ' 
| |3 
= 
' ' Fix rOR 中 断 、 
2 ! SPp、PSW 陷入 处 理 
! PSW、 pc : 
| 1 1 #6 
| 人) Re 本 
PSW、pc ri Os PT 
' tr sp、PSW | 
图 5-5 中断 和 陷入 
发 生 中 断 或 陷入 


当中 断 或 陷入 发 生 并 通知 系统 后 ,执行 进程 的 PSwW 和 pc 将 被 压 入 内 核 
栈 ， 然 后 从 与 中 断 或 陷入 通知 一 起 送 来 的 向 量 指向 的 地 址 中 读 取 并 设 
置 PSW 和 pc。 此 处 理 通 过 硬件 完成 。 


更 新 PSW 后 ， 执 行进 程 变 为 内 核 进程 。 将 pc 设置 为 与 此 中 断 或 陷入 
的 种 类 相对 应 的 地 址 ， 这 使 得 系统 开始 执行 中 断 或 陷入 处 理 。 


接 下 来 看 一 下 位 于 内 核 程 序 低位 地 址 的 代码 ， 此 处 容纳 与 向 量 相对 应 
的 数据 (代码 清单 5-2) 。 


代码 清单 5-2 内核 低位 地 址 《unix/lows) 


1 

2 

3 br4 = 200 

4 br5 = 240 

5 br6 = 300 

6 br7 = 340 

7 

8 .= 0^， 

9 br 1f 
10 4 
11 
12 / trap vectors 
13 trap; br7+0. / bus error 
14 trap; br7+1. / illegal instruction 
15 trap; br7+2. / bpt-trace trap 
16 trap; br7+3. / iot trap 
17 trap; br7+4. / power fail 
18 trap; br7+5. / emulator trap 
19 trap; br7+6. / system entry 
20 
21 ，= 40^， 

22 .globl start, dump 

23 1: jmp start 

24 jmp dump 

25 

26 .= 60^， 

27 klin; br4 

28 klou; br4 

29 

30 ，= 100^， 

31 kwlp; br6 

32 kwlp; br6 

33 

34 .= 114^， 

35 trap; br7+7. / 11/70 parity 
36 

37 ,= 214^， 

38 tcio; br6 

39 
40 . = 224^， 
41 tmio; br5 
42 


43 . = 240^， 


44 trap; br7+7. / programmed interrupt 


45 trap; br7+8. / floating point 

46 trap; br7+9. / segmentation violation 
47 

48 . = 254^， 

49 hpio; br5 

50 

51 A////1t11111111111111111111111111111111111111111111111/11 
52 / interface code to C 


53 /LALLLALALALALALALALALALAUALALALAALALALALAUAUALAUAUALAUAALALAAALALALALALALALALALALALALALAALALAAAY 
55 .globl call, trap 


57 .globl _kilrint 
58 klin: jsr ro,call; _klrint 
59 .globl _klxint 
60 klou: jsr ro,call; _klxint 


62 .globl _clock 
63 kwlp: jsr ro,call; _clock 


64 

65 .globl _tcintr 

66 tcio: jsr ro,call; _tcintr 
67 

68 .globl _tmintr 

69 tmio: jsr ro,call; _tmintr 
70 


71 .globl _hpintr 
72 hpio: jsr ro,call; _hpintr 


发 生 中 段 时 的 处 理 


人 前 发 生 了 中 断 向 量 为 0100 的 时 钟 中 断 ， 下 面 以 此 为 前 提 进 行 说 
明 。 


第 30 行 的 ，= 100^, 表示 当 程序 被 读 入 内 存 时 ， 此 处 的 地 址 为 
0100。 第 31 行 的 两 个 字 kwlp 和 br6 分 别 保存 在 pc 和 PSW 中 。 因 为 
br6 的 值 为 0300， 所 以 处 理 絮 优先 级 PSW[7-5] 的 值 为 6。 由 于 将 pc 
设 定 为 kwlp ， 因 此 中 上 断 处 理 从 kwlp 标签 的 位 置 开始 执行 。 


kwlp 标签 所 在 的 第 63 行 的 jsr 指令 首先 被 执行 。jsr r9，cal1; 
_clock 将 rg 的 值 压 入 栈 ， 并 将 pc 设 定 为 call 标签 指 回 的 地 址 。 


然后 将 r0 设 定 为 clock (clock( ) 函数 ) 的 地 址 。 此 处 rg 指向 的 
函数 即 为 中 断 种 类 对 应 的 中 断 处 理 函 数 ( 表 5-3, 表 5-4) 。 


表 5-3 内 核 栈 的 状态 


旧 
被 中 断 进程 的 pc 
被 中 断 进程 的 PSW 


表 5-4 寄存 器 的 状态 


Il 条 处 理 函 数 clock( 的 地 址 ) 


发 生 陷入 时 的 处 理 


下 面 考虑 一 下 由 sys 指令 触发 的 陷入 的 情况 。sys 指令 的 陷入 向 量 为 
034。 第 19 行 的 trap ; br7+6 分 别 保存 在 pc 和 PSW 中 。 由 于 br7 
的 值 为 0340， 因 此 处 理 器 优先 级 PSW[7-5] 的 值 为 7。 另 外 ，PSW 低 
位 的 3 比特 记录 了 陷入 的 种 类 ， 此 处 的 值 为 6。 


执行 call 和 trap 


用 汇编 语言 编写 的 call 和 trap 分 别 调用 相应 的 中 断 处 理 函 数 或 陷入 
处 理 函 数 (代码 清单 5-3) 。 发 生 中 断 时 调用 保存 在 r9 中 的 中 断 处 理 


函数 。 发 生 陷 入 时 ， 如 果 nofault 被 设 定 了 陷入 处 理 函 数 ， 则 调用 该 
处 理 画 数 ， 如 果 未 设 定 ， 则 调用 trap( ) 函数 。 


代码 清单 5-3 call0,trap0 (conf/m40.s) 


1 .globl trap, call 
2 .globl _trap 
3 trap: 
4 mov PS, -4(sp) 
5 tst nofault 
6 bne 1f 
7 mov SSRO, ssr 
8 mov SSR2, ssr+4 
9 mov $1, SSRO 
10 jsr ro,call1i; _trap 
11 / no return 
12 1: 
13 mov $1, SSRO 
14 mov nofault, (sp) 
15 rtt 
16 
17 .globl _runrun, _swtch 
18 calli: 
19 tst - (sp) 
20 bic $340, PS 
21 br 1f 
22 
23 call: 
24 mov PS,-(sp) 
25 1: 
26 mov r1i,-(sp) 
27 mfpi sp 
28 mov 4(sp),-(sp) 
29 bic $137, (sp) 
30 bit $30000, PS 
31 beq 1f 
32 jsr pc,* (roO)+ 
33 2: 
34 bis $340, PS 
35 tstb  _runrun 
36 beq 2f 
37 bic $340, PS 
38 jsr pc,_swtch 
39 br 2b 
40 2: 
41 tst (sp)+ 
42 mtpi sp 


43 br 2f 


bis $30000,PS 
jsr pec, * (ro)+ 
cmp (sp)+, (sp)+ 


48 2: 

49 mov (sp)+,r1 
50 tst (sp)+ 

51 mov (sp)+,r0 
52 rtt 


中 断 处 理 的 流程 
首先 来 看 一 下 中 断 处 理 的 流程 。 处 理 从 call 标签 处 开始 执行 。 假 设 


此 
r0 


时 发 生 了 时 钟 中 断 ， 那 么 中 断 处 理 函 数 clock( ) 的 地 址 就 会 保存 在 
中 o 

24~26 将 PSW 与 pc 压 入 栈 。 

27 “将 被 中 断 的 进程 的 sp 压 入 栈 。mfpi 指令 用 来 将 PSW 表示 

的 前 一 模式 的 虚拟 地 址 空间 的 值 压 入 当前 模式 的 地 址 空间 的 栈 顶 

部 。sp 和 其 他 的 通用 寄存 器 的 不 同 之 处 在 于 存在 两 套 ， 分 别 供用 
户 模式 和 内 核 模式 使 用 。 内 核 进 程 在 访问 用 户 进 程 的 sp 时 需要 使 
用 特殊 的 指令 。 


28 “将 在 第 24 行 压 入 栈 的 PSW 再 次 压 入 栈 ( 表 5-5) 。 
29 ”将 位 于 栈 顶部 的 PSW 的 除 低 位 5 比特 之 外 的 部 分 清 0。 


30~31 ”检查 被 中 断 的 进程 的 模式 ， 如 果 为 内 核 模 式 则 跳 转 到 第 

44 行 。 

32 ”如果 被 中 断 的 进程 为 用 户 进程 ， 则 使 用 jsr 指令 跳 转 到 rg 
指 回 的 地 址 。 然 后 将 当前 pc 保存 于 栈 中 ， 作 为 从 中 断 处 理 函 数 返 
回 时 的 地 址 ( 表 5-6) 。 


表 5-5 栈 的 状态 


断 的 进程 的 sp 


的 rl 


的 r0 


断 的 进程 的 pc 


被 中 断 的 进程 的 PSW 


表 5-6 栈 的 状态 


从 中 断 处 理 函 数 返 回 时 的 地 址 ) 


过 掩 码 的 PSW 


' 断 的 进程 的 sp 


二 ea 


日 的 r0 


被 中 断 的 进程 的 pc 
被 中 断 的 进程 的 PSW 


34 ”从 中 断 处 理 画 数 返 回 后 进行 的 处 理 。 将 处 理 右 优先 级 设置 为 
7 防止 发 生 中 断 。 


35~36 ”如 果 未 设置 标志 变量 runrun 1 ， 则 跳 转 到 第 40 行 。 
37~38 ”如 果 设 置 了 标志 变量 runrun ， 则 将 处 理 器 优先 级 重 置 为 
0。 由 于 与 执行 进程 《被 中 断 的 进程 ) 相 比 存在 执行 优先 级 更 高 的 
进程 ， 因 此 执行 swtch( ) 切换 执行 进程 。 


39 ” 当 此 进程 再 次 执行 时 ， 返 回 第 33 行 的 位 置 再 次 检查 标志 变量 
FUnFUPn ° 


41 ”如 果 未 设置 标志 变量 runrun ， 被 中 断 的 进程 将 再 次 获得 控 
制 权 。 保 存 于 栈 中 的 经 过 掩 码 的 PSW 会 被 忽略 。 


42 ”恢复 保存 于 栈 中 的 被 中 断 的 进程 的 sp。mtpi 指令 用 来 复制 
前 一 处 理 器 模式 (由 PSW 表示 ) 虚拟 地 址 空间 中 栈 顶 部 的 值 。 


43 ” 跳 转 到 第 48 行 。 
49~51 ”恢复 保存 在 栈 内 的 rl 和 r0， 名 上 略 PSW ( 表 5-7) 。 
52 ”执行 rtt 指令 ， 恢 复 保存 在 栈 中 的 被 中 断 的 进程 的 PSW 和 


pc， 并 继续 被 中 断 的 进程 的 处 理 。rtt 指令 用 来 将 栈 顶 部 两 个 字 
长 的 数据 设置 到 PSW 和 pc 中 。 


45~46 ”被 中 断 的 进程 为 内 核 进程 时 ， 将 前 一 模式 设置 为 用 户 模 

式 ， 然 后 跳 转 到 由 r9 指 辣 的 中 断 处 理 函 数 的 位 置 。 

47 ”从 中 断 处 理 画 数 返 回 后 ， 急 略 栈 顶部 的 经 过 掩 码 的 PSW 以 及 

ud sp。 之 后 的 处 理 与 用 户 进程 被 中 断 时 的 处 理 相同 
D-8) 。 


1runrun 是 全 局 进程 调度 标志 。 操 作 系 统 会 在 某 些 情况 (比如 在 发 现 有 优先 级 更 高 的 进程 可 
以 上 台 时 ) 下 置 runrun ， 要 求 在 合适 的 时 机 (比如 此 处 ) 进行 进程 调度 。 审 校 者 注 


表 5-7 栈 的 状态 


从 中 断 处 理 函 数 返 回 时 的 地 址 ) 


过 掩 码 的 PSW 


! 断 的 进程 的 sp 


的 r1 


的 r0 


' 断 的 进程 的 pc 


被 中 断 的 进程 的 PSW 


表 5-8 栈 的 状态 


从 中 断 处 理 函 数 返 回 时 的 地 址 ) 


过 掩 码 的 PSW 


! 晰 的 进程 的 sp 


的 r1 


的 r0 


' 断 的 进程 的 pc 


被 中 断 的 进程 的 PSW 


陷入 处 理 的 流程 
接 下 来 看 一 下 陷入 处 理 。 处 理 从 trap 标签 的 位 置 开 始 执 行 。 


4 将 PSW 复制 到 距 栈 顶 部 两 个 字 长 的 位 置 。 因 为 PSW 包含 着 与 
陷入 种 类 相关 的 信息 ， 因 此 需要 马上 保存 ( 表 5-9) 


5~6 ”检查 nofault ， 如 果 已 设置 了 nofault ， 则 跳 转 到 第 12 
行 。 


7~10 ”如 果 未 设置 nofault ， 则 保存 SRO0 和 SR2 的 当前 状态 ， 
初始 化 SR0 之 后 使 用 j sr 指令 跳 转 到 calL11 的 位 置 。r0 被 压 入 
栈 ， 它 保存 着 trap( ) 的 地 址 ( 表 5-10) 。 


表 5-9 栈 的 状态 


19~20 ”将 sp 同上 移动 一 个 位 置 ， 并 将 处 理 右 优先 级 设置 为 0 。 


21 跳 转 至 第 25 行 。 从 此 处 开始 的 处 理 与 中 断 处 理 时 相同 。 因 为 
r0 保存 着 trap( ) 的 地 址 ， 所 以 可 以 通过 第 32 行 或 第 46 行 的 
jsr 指令 跳 转 到 trap( ) 的 位 置 。 


13~14 ”如 果 已 设置 nofault ， 则 初始 化 SRO0， 然 后 将 保存 在 栈 
顶部 被 中 断 的 进程 的 pc 值 用 nofault 的 值 替换 ( 表 5-11) 


15 ”使 用 rtt 指令 恢复 栈 顶部 的 PSW 和 pc。 将 pc 设置 为 
nofault 的 值 ， 控 制 权 转交 给 由 nofault 指定 的 陷入 处 理 函 
数 。 隐 入 处 理 函 数 通 过 rts 指令 终止 运行 。 栈 顶部 保存 着 从 触发 
陷入 的 函数 返回 时 的 地 址 ， 因 此 将 返回 至 该 地 址 ( 表 5-12) 。 


表 5-11 栈 的 状态 


人 陷入 种 类 信息 的 PSW 


nofault 


被 中 断 的 进程 的 PSW 


人 陷入 种 类 信息 的 PSW 


被 中 断 的 进程 的 PSW 


> \ 从 陷入 发 生 位 置 返回 时 的 地 址 ) 


5.4 ”时 钟 中 断 处 理 范 数 


本 节 以 时 钟 中 断 处 理 画 数 为 例 介绍 中 断 处 理 画 数 。 此 外 ， 块 设备 的 中 
断 处 理 画 数 的 介绍 请 见 第 8 章 ， 字 符 设备 的 中 断 处 理 画 数 请 参考 第 12 
章 ， 终 端的 中 断 处 理 函 数 也 会 在 第 13 章 中 进行 介绍 。 

时 钟 设备 的 规格 


时 钟 设备 是 用 来 定期 向 系统 发 出 中 断 请 求 的 设备 。 系 统 通过 时 钟 中 断 
对 时 间 等 进行 管理 。 时 钟 中 断 的 间 隅 被 称 为 tick 。 


UNIX V6 可 以 使 用 两 种 时 钟 设备 。 两 种 设备 中 的 某 一 种 必须 处 于 可 用 
状态 ， 两 者 都 可 用 的 时 候 KW11-L 优先 。 


。 通过 电源 频率 生成 时 钟 的 KW11-L 
。 可 编程 时 钟 KW11-P 


KW11-L 通过 电源 频率 生成 时 钟 。 时 钟 频率 依赖 电源 频率 ， 为 60Hz 或 
50Hz ( 表 5-13) 。 


表 5-13 KW11-L 的 寄存 器 


以 将 其 清 


! 呆 有 效 ， 清 0 时 不 引发 中 断 


KW11-P 为 可 编程 的 时 钟 设备 。 时 钟 发 生 的 间 隅 可 通过 程序 设 定 。 当 内 
部 计数 器 发 生 向 上 或 向 下 溢出 时 引发 中 断 ( 表 5-14) 。 


表 5-14 KW11-P 的 寄存 器 


比特 
入 


比特 
位 


计数 器 向 上 或 癌 下 洪 出 时 置 1， 并 


- ! 呆 有 效 位 。 置 1 时 中 断 有 效 ， 清 0 时 不 引发 


来 停止 计数 器 


: 递增 计数 器 ，0 : 递减 计数 器 


: 重复 时 钟 中 断 ，0 : 只 引发 1 次 时 钟 中 断 


1 听闻 隔 。00 : 100KHz, 01: 10KHz，10 : 
傅 入 引发 


动 计数 器 


系统 管理 者 通过 param.h 中 的 HZ 来 设 定 时 钟 频率 ， 并 根据 需要 重新 
构筑 系统 内 核 (代码 清单 5-4) 。 


代码 清单 5-4 HZ (param.h) 


1 #define HZ 60 


以 下 内 容 以 时 钟 频率 等 于 60Hz 为 前 提 进 行 说 明 。 
时 钟 中 断 处理 函 数 的 内 容 


时 钟 中 断 是 定期 发 生 的 ， 时 钟 中 断 处 理 函 数 在 中 断 发 生 时 会 进行 下 述 
处 理 ， 同 时 以 1 秒 和 4 秒 的 周期 进行 相应 的 处 理 (图 5-6) 。 


。 时钟 中 断 发 生 时 的 处 理 
o 再 次 设 定时 钟 设备 的 寄存 器 
。 在 指定 时 刻 执行 事先 登录 的 函数 
o 递增 CPU 时 间 

。 以 1 秒 为 周期 进行 的 处 理 
o 时 间 处 理 
。 唤起 通过 系统 调用 sleep 的 进程 
。 对 进程 的 执行 优先 级 进行 再 计算 
。 尝试 对 进程 进行 再 调度 
。 对 信号 进行 处 理 

。 以 4 秒 为 周期 进行 的 处 理 


o lightning bolt 


时 间 


时 钟 设备 执行 进程 | 内 核 进程 
4 所 以 1 秒 为 周期 
1 | 义 1 秒 为 周 其 
er 一 全 clock() 一 进行 的 处 理 一 |bolt 处 理 
> | 
一 一 天 clock() | 
= = — | » clock0 : 
| : 1 秒 
一 一 clock 
一 一 一 一 一 | > clock() 一 > 以 1 秒 为 周期 4 秒 
' : 0 进行 的 处 理 
一 > 以 1 秒 为 周 其 
进行 的 处 理 
以 1 秒 为 周期 S 
迁 行 的 处 理 = 才 p 全 
图 5-6 ”时钟 中 断 
时 钟 设备 寄存 器 的 再 设 定 


清除 时 钟 设备 寄存 器 中 的 中 断 发 生 位 ， 使 时 钟 中 断 可 以 再 次 被 触发 。 
定时 执行 

内 核 通过 timeout () 函数 可 以 指定 某 个 函数 在 某 个 时 钟 tick 后 执 
行 。 时 钟 中 断 处 理 函 数 在 上 述 指 定 的 时 刻 执行 该 画 数 。 内 核 利 用 
callo 结构 体 的 数组 callout[] 管理 需要 定期 执行 的 函数 (代码 清 
单 5-5， 代 码 清单 5-6, 表 5-15) 。 


代码 清单 5-5 callo (system.h) 


1 struct callo 


2 


int c_time; 

int c_arg; 

int (*c_func)(); 
} callout[NCALL]; 


代码 清单 5-6 NCALL (param.h) 


1 #define NCALL 20 


表 5-15 callo 结构 体 


函数 执行 时 间 (tick) 。 距 前 一 元 素 的 相对 时 间 


ee 
指向 定时 执行 的 函数 的 指 和 


callo 结构 体 表示 ， 在 指定 时 间 (c_time ) 后 执行 指定 函数 
c_func ， 并 将 c_arg 作为 参数 传 给 该 函数 。callout[] 的 元 素 按 
照 执 行 顺 序 排列 ， 执行 过 的 元 素 (callo 结构 体 ) 将 从 callout[] 
中 移 除 。callo 结构 体 的 c_time 不 是 以 绝对 时 间 的 形式 ， 而 是 以 距 
前 一 个 callo 结构 体 的 相对 时 间 的 形式 设 定 的 (图 5-7) 。 


ctime ctme ctme ctime ctime 


图 5-7 callout[] 


timeout () 函数 用 来 指定 在 某 一 时 间 执 行 某 个 函数 。 它 同 
追加 元 素 并 使 其 按照 执行 顺序 排列 ( 表 5-16， 代 码 清单 5- 
7 Oo 


表 5-16 timeout( 的 参数 


ee 
丽 行 时 间 (sel 


代码 清单 5-7 timeout (ken/clock.c) 


imeout(fun, arg, tim) 


t 
{ 
register struct callo *pi, *p2; 
register tt; 
int s; 


en 

= PS->integ; 
= &callout[0]; 
sp17(); 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 
1 while(p1i->c_func != © && pi->c_ time<= t) { 


1 
1 


12 t =- pi->c_time; 


13 p1++， 
14 } 

15 pi->c_time =- 七 

16 p2 = pi; 

17 while(p2->c_func != 0) 

18 p2++; 

19 while(p2 >= p1) { 

20 (p2+1)->c_time = p2->c_time,; 
21 (p2+1)->c_func = p2->c_func; 
22 (p2+1)->c_arg = p2->c_arg; 
23 p2--; 

24 } 

25 pi->c_time = t，; 

26 pi->c_func = fun; 

27 pi->c_arg = arg; 

28 PS->integ = s; 

29 } 


10 ”将 处 理 器 优先 级 提升 至 7 防止 发 生 时 钟 中 断 。 因 为 时 钟 中 电 
处 理 函 数 的 内 部 也 会 操作 callout[] ， 为 了 避免 与 timeout 下 
面 的 处 理发 生 冲 突 ， 进 行 了 上 述 处 理 。 


11~14 从 callout[] 的 起 始 位 置 思 历 数组 ， 跳 过 那些 执行 时 间 
早 于 参数 指定 时 间 的 元 素 ， 同 时 用 参数 指定 的 时 间 减 去 
callo.c_time ， 得 到 距 前 一 元 素 的 相对 时 间 。 
15 ”调整 排 在 追加 元 素 之 后 的 元 素 的 相对 时 间 。 
16~18 ”将 指针 移动 至 最 终 有 效 元 素 之 后 的 位 置 。 
19~24 “将 排 在 追加 元 素 之 后 的 元 素 向 后 依次 移动 一 个 位 置 。 
25~27 “追加 一 个 元 素 。 
28 ”恢复 处 理 需 优先 级 。 

系统 调用 sleep 


系统 调用 sleep 使 执行 进程 进入 睡眠 状态 直至 指定 时 间 。 到 达 指 定时 
间 后 通过 时 钟 中 断 处 理 函 数 唤 醒 该 进程 。sslep( ) 为 系统 调用 Sleep 


的 处 理 函 数 ( 表 5-17， 代 码 清 单 5-8) 。 
表 5-17 系统 调用 sleep 的 参数 


| 


"i 


代码 清单 5-8 sslep0 (ken/sys2.c) 


char *d[2]; 


sp17(); 

d[90] = time[0]; 

d[1] = time[1]; 
dpadd(d, u.u_arO[RO]); 


while(dpcmp(d[90], d[1], time[0], time[1]) > 0) { 
if(dpcmp(tout[0], tout[1], time[0], time[1]) <= 0 || 
dpcmp(tout[0], tout[1], d[0o], d[1]) > 0) { 
tout[0] = d[0]; 
tout[1] = d[1]; 


} 
sleep(tout, PSLEP); 


sp10( ); 


时 间 处 理 
时 钟 中 断 处 理 函 数 以 工 秒 的 周期 递增 表示 时 间 的 变量 time。 
递增 CPU 时 间 


CPU 时 间 表 示 某 个 进程 占用 CPU 的 时 间 。 执 行进 程 的 proc.p_cpu 
在 发 生 时 钟 中 断 时 递增 。 用 户 模式 和 内 核 模式 下 占用 CPU 的 时 间 是 分 


别 进 行 管理 的 ， 发 生 时 钟 中 断 时 ， 如 果 为 用 户 模式 则 递增 
user.uU_utime ， 如 果 为 内 核 模式 则 递增 user.u_stime 。 


再 计算 执行 优先 级 

以 1 秒 为 周期 递增 全 部 进程 的 proc.p_time 。proc.p_time 表 不 
该 进程 在 内 存 或 交换 空间 停留 的 时 间 ， 对 计算 执行 优先 级 有 很 大 的 影 
啊 。 随 后 执行 setpri( ) 重新 计算 进程 的 执行 优先 级 。 

尝试 对 进程 进行 再 调度 


如 果 内 存 或 交换 空间 中 刚刚 移入 的 进程 导致 交换 处 理 无 法 继续 进 
则 唤醒 调度 器 尝试 对 进程 进行 再 调度 。 


信号 处 理 
如 果 执 行进 程 为 用 户 进程 ， 并 且 已 接收 到 信号 ， 则 对 信号 进行 处 理 。 


lightning bolt 


时 钟 中 断 处 理 函 数 以 4 秒 为 周期 ， 将 proc.p_wchan 设置 为 lbolt 变 
量 (代码 清单 5-9 ) 的 地 址 ， 并 唤醒 入 睡 的 进程 。 此 处 理 被 称 为 
lightning bolt。 


代码 清单 5-9 lbolt (system.h) 


1 nt lbolt; 


对 于 不 存在 使 其 再 次 运行 的 事件 ， 并 且 待 机 时 间 亦 不 明确 的 内 核 进程 
而 言 ， 可 以 利用 lightning bolt 进行 短 时 间 的 睡眠 。 


clock() 


clock( ) 为 时 钟 中 断 处 理 函 数 (代码 清单 5-10 ) 。 执 行 权 转 交 给 
clock() 时 ， 栈 的 状态 如 表 5-18 所 示 。 


表 5-18 执行 权 转 交 给 clock() 时 栈 的 状态 


pc 


( 
经 过 掩 码 的 PSW 


纹 中 断 的 进程 的 sp 


从 中 断 处 理 函 数 返回 时 的 地 址 ) 
捧 码 区 


的 r1 


条 的 进程 的 pc 


被 中 断 的 进程 的 PSW 


| csvV。r5、r4、r3、I2 被 压 入 栈 ( 表 5-19 


表 5-19 在 clock(0 内 执行 csv 后 栈 的 状态 以 及 fl clock() 的 参数 的 对 应 


pd 


的 r2 


的 r3 


的 r4 


的 r5 


\ 从 中 断 处 理 函 数 返回 时 的 地 址 ) 


过 掩 码 的 PSW 


被 中 断 的 进程 的 sp 


的 rl 


的 r0 


被 中 断 的 进程 的 pc 


疏 中 断 的 进程 的 PSW 


传递 给 中 断 处 理 函 数 的 参数 为 、 
离 栈 中 r5 所 在 位 置 两 个 字 长 0 2 处 理 压 入 栈 的 值 ， 距 


代码 清单 5-10 ”dlock0 (ken/clock.c) 


C 
{ 


out: 


lock(dev, sp, ri1i, nps, ro, pc, ps) 


register Struct callo *pi, *p2; 
register struct proc *pp; 


/* 对 时 钟 设备 的 寄存 器 进行 再 设 定 */ 
*]ks = 0115; 


display(); 


/* callout 处 理 */ 
if(callout[0].c_func == 0) 
goto out ; 
p2 = &callout[0]; 
while(p2->c_time<=0 && p2->c_func!=0) 
p2++; 
p2->c_time--; 


if((ps&0340) != 0) 
goto out; 


spl5( ); 
if(callout[0].c time <= 0) { 
p1 = &callout[0]; 
while(pi->c_func != 0 && p1->c time <= 0) { 
(*p1i->c_func)(p1i->c_arg); 
pl++; 


} 
p2 = &callout[0]; 
while(p2->c_func = p1->c_func) { 
p2->c_time = pi->c_time,; 
p2->c_arg = pi->c_arg; 
pi， 
p2++; 


/* 递增 CPU 时 间 */ 
if((ps&UMODE) == UMODE) { 
U.U_Uutimet+; 
if(u.u_prof[3]) 
incupc(pc, u.u_prof); 
} else 
U.U_Stimet++; 
pp = u.u_procp; 
if(++pp->p_cpu == 0) 
pp->p_cpu--, 


50 /* 以 1 秒 为 周期 的 处 理 */ 


51 if(++lbolt >= HZ) { 

52 if((ps&0340) != 0) 

53 return; 

54 lbolt =- HZ， 

55 /* 递增 时 间 */ 

56 if(++time[1] == 0) 

57 ++time[0]; 

58 spl11(); 

59 /* 唤醒 通过 系统 调用 Sleep 进入 睡 眼 状态 的 进程 */ 
60 if(time[1]==tout[1] && time[0]==tout[0] ) 
61 wakeup (tout); 

62 /* lightning bolt */ 

63 if((time[1]&03) == 0) { 

64 runrunt+; 

65 wakeup(&1lbolt ); 

66 } 

67 /* 递增 proc.p_time， 并 对 执行 优先 级 进行 再 计算 */ 
68 for(pp = &proc[0]; pp < &proc[NPROC]; pp++) 
69 if (pp->p_stat) { 

70 if(pp->p_time != 127) 

71 pp->p_timet+; 

72 if((pp->p_cpu & 0377) > SCHMAG) 
73 pp->p_cpu =- SCHMAG; else 
74 pp->p_cpu = 0; 

75 if(pp->p_pri > PUSER) 

76 setpri(pp); 

77 } 

78 /* 演 试 对 进程 进行 再 次 调度 */ 

79 if(runin!=0) { 

80 runin = 0; 

81 wakeup(&runin); 

82 } 

83 /* 信号 处 理 */ 

84 if((ps&UMODE) == UMODE) { 

85 U,.U_arg = &rO; 

86 if(issig()) 

87 psig(); 

88 setpri(u.u_procp); 

89 

90 

91 } 


7 ”这 种 写法 可 以 正确 设置 KW11-L 和 KW11-P 两 种 时 钟 设备 的 寄 


口 蝇 


幸 


〇 


9 display() 在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 
12~13 “如果 callout[] 中 不 存在 需要 执行 的 元 素 ， 则 跳 转 到 


OUt 。 


14~17 ”对 callout[] 中 未 到 执行 时 间 的 元 素 ， 递 城 其 中 首 个 元 
素 callo.c_time 。 因 为 callo.c _time 为 距 前 一 个 元 素 的 相 
对 时 间 ， 所 以 如 果 改 变 了 第 一 个 元 素 的 值 ， 对 排 在 后 面 的 所 有 元 

素 都 会 产生 影响 。 


19~20 ”被 中 断 的 进程 的 处 理 器 优先 级 如 果 不 为 0， 就 不 处 理 
callout[] ， 跳 转 到 out 。? 


23~36 ”如 采 callout[] 中 存在 callo.c_time<=0 的 元 素 ， 
那么 就 执行 该 元 素 的 c_func(c_arg) ， 并 将 
callo.c_time>0 的 元 素 向 前 方 移动 。 


UMODE 用 来 检查 PSW 是 否 被 设置 了 用 户 模 式 (代码 清单 5- 
11) 。 


? 此 处 的 意图 是 若 处 理 器 优先 级 大 于 0， 意 味 着 有 更 紧急 的 事物 处 理 ， 则 延缓 调用 
callout[] 中 计划 的 任务 。 审 校 者 注 


3 此 处 检查 UMODE 的 意图 是 : 若 先前 为 用 户 态 ， 且 启用 了 统计 直方 图 ， 则 要 更 新 统计 直方 
图 。 但 由 于 本 书 不 涉及 统计 直方 图 的 内 容 ， 请 忽略 这 部 分 。 审 校 者 注 


代码 清单 5-11 UMODE (ken/clock.a 


1 #define UMODE ©0170000 


51 可 增 1bolt 。 如 采 已 经 经 过 了 1 秒 以 上 的 时 间 ， 则 局 动 以 1 
秒 为 周期 的 处 理 。 


52~53 ”如 果 被 中 断 的 进程 的 处 理 妖 优先 级 不 为 0 则 返回 。 


54 ”从 1bolt 递减 相当 于 1 秒 的 值 。 


58 ”将 处 理 妖 优先 级 设 定 为 1° 此 后 的 操作 需要 花费 一 些 时 间 ， 
因此 可 以 适当 降低 处 理 如 优先 级 。 


63~66 ”进行 lightning bolt 处 理 。 以 4 秒 为 周期 唤醒 通过 Lpolt 
进入 睡眠 状态 的 进程 。 设 置 标 志 变 量 runrun ， 表 示 存 在 执行 优 
先 级 较 高 的 进程 ( 即 通 过 1bolt 进入 睡眠 状态 的 进程 ) 。 


68~77 “对 所 有 存在 的 进程 进行 下 述 处 理 。 递 增 proc,.p_time ， 
最 大 值 为 127。 调 整 pbroc,p_cpu 使 其 最 大 值 小 于 SCHMAG ( 代 
码 清单 5-12) 。 如 果 执 行 优先 级 小 于 或 等 于 基准 值 PUSER (代码 
清单 5-13) ， 将 再 次 计算 执行 优先 级 。 


代码 清单 5-12 SCHMAG (ken/clock.c) 


1 #define SCHMAG 10 


代码 清单 5-13 PUSER (param.h) 


1 #define PUSER 100 


85 “为 了 让 信号 处 理 函 数 能 够 访问 被 中 断 的 进程 的 寄存 器 ， 将 
U.U_ar0 设 定 为 保存 于 栈 中 的 rg 的 地 址 。 


5.5 “陷入 处 理 函 数 


陷入 处 理 画 数 根据 陷入 的 种 类 进行 相应 的 处 理 。 很 多 情况 下 通过 向 自 
己 发 送信 号 ， 将 其 后 的 处 理 委托 给 信号 处 理 画 数 。 


trap() 


trap( ) 为 一 数 (代码 } 
. 清单 5-14 ) 。 与 
0 相同 ， 将 通过 call 和 trap 保存 在 栈 中 的 值 作为 参数 ( 表 


表 5-20 在 trap0 内 执行 csv 后 栈 的 状态 ， 以 及 fl trap0 的 参数 的 对 应 


pd 


\ 从 陷入 处 理 函 数 返回 时 的 地 址 ) 


过 掩 码 的 PSW 


被 中 断 的 进程 的 sp 


的 rl 


的 r0 


wo 
国 被 中 断 的 进程 的 pc | 


国 [ 中断 的 进程 的 PSW .| 


代码 清单 5-14 trap() (kenm/trap.c) 


1 trap(dev, sp, ri, nps, ro, pc, ps) 
2{ 

3 register i, a; 

4 register struct sysent *callp; 
5 

6 savfp( ) ， 

7 if ((ps&UMODE) == UMODE) 

8 dev =| USER; 

9 U,.U_arg = &roO; 
10 
11 switch(dev) { 
12 
13 default: 
14 printf("ka6 = %o\n", *ka6); 
15 printf("aps = %o\n", &ps); 
16 printf("trap type %o\n", dev); 
17 panic("trap"); 

18 

19 case 0+USER: /* bus error */ 

20 i = SIGBUS,; 

21 break; 

22 

23 case 1+USER: /* illegal instruction */ 
24 if(fuiword(pc-2) == SETD && uU,U_Ssignal[SIGINS] == 0) 
25 goto out ; 

26 i = SIGINS 

27 break; 

28 

29 case 2+USER: /* bpt or trace */ 
30 i = SIGTRC; 

31 break; 

32 

33 case 3+USER: /* iot */ 

34 i = SIGIOT， 


35 break; 


case 5+USER: /* emt */ 
i = SIGEMT; 
break; 


case 6+USER: /* sys call */ 
Uu.u_error = 0; 
ps =& ~EBIT， 
callp = &sysent[fuiword(pc-2)&077]; 
if (callp == sysent) { /* indirect */ 
a = fuiword(pc); 
pc =+ 2; 
i = fuword(a); 
if ((i & ~077) != SYS) 
i = 077; /* illegal */ 
callp = &sysent[i&077]; 
for(i=0; i<callp->count; i++) 
u.u_arg[i] = fuword(a =+ 2); 
} else { 
for(i=0; i<callp->count; i++) { 
u.u_arg[i] = fuiword(pc); 
pc =+ 2; 


} 
} 
u.u_dirp = u.u_arg[0]; 
trapi(callp->call); 
if(u.u_intflg) 
U,.U_error = EINTR; 
if(u.u_error < 100) { 
if(u.u_error) { 
ps =| EBIT; 
r9 = U,U_error， 


goto out 
i = SIGSYS 
break; 


case 8: /* floating exception */ 
psignal(u.u_procp, SIGFPT); 
return; 


case 8+USER : 
i = SIGFPT， 
break 


case 9+USER: /* segmentation exception */ 
a = sp; 
if(backup(u.u_ar0) == 0) 
if(grow(a)) 
goto out; 


87 i = SIGSEG; 


88 break; 

89 } 

90 

91 psignal(u.u_procp, i); 
92 

93 Out : 

94 if(issig()) 

95 psig( ); 

96 setpri(u.u_procp); 

97 } 


6 savfp() 在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 
7~8 ”如 果 触 发 陷入 的 进程 为 用 户 进程 ， 则 设置 dev 的 USER 标 
志 位 (= 第 4 比特 位 ， 代 码 清单 5-15) 。 此 后 的 处 理 通过 此 标志 
位 来 判断 触发 陷入 的 进程 为 用 户 进程 还 是 内 存 进 程 。 


代码 清单 5-15 UMODE 和 USER (ken/trap.c) 


1 #define UMODE ©0170000 
2 #define USER 020 


9 将 u.u_arg 设 定 为 保存 于 栈 中 的 r9 的 地 址 。 通 过 
uU.U_arg[Rn] 可 以 访问 触发 陷入 的 进程 的 r0~r7， 以 及 PSW。 请 
注意 ， 保 存 于 栈 中 的 值 最 终 将 会 恢复 至 用 户 进 程 。Rn 在 reg.h 
中 被 定义 (代码 清单 5-16) 。 


代码 清单 5-16 Rn (reg.h) 


1 #define RO (0) 

2 #define R1 (-2) 
3 #define R2 (-9) 
4 #define R3 (-8) 
5 #define R4 (-7) 
6 #define R5 (-6) 
7 #define R6 (-3) 


8 #define R7 (1) 
9 #define RPS (2) 


I Rn 的 值 与 保存 于 栈 中 的 rg 的 相对 位 置 保持 一 致 ( 表 5-21 


表 5-21 在 trap( 内 执行 csv 后 栈 的 状态 


过 掩 码 的 PSW 


被 中 断 的 进程 的 sp 


的 rl 


从 隐 入 外 香雪 返回 时 的 地 直 ) Ee 


旧 的 r0 


11 dev 的 值 为 陷入 种 类 。 根 据 dev 进行 相应 的 处 理 。 


13~17 ”在 内 核 进程 内 发 生 陷入 时 的 处 理 。trap( ) 基本 没有 考虑 
过 要 如 何 处 理 这 种 情况 ， 通 第 是 将 nofault 指向 陷入 处 理 函 数 ， 
由 该 函数 进行 后 续 处 理 。 因 此 ， 此 处 在 输出 内 核 PAR6、 被 陷入 中 
断 的 进程 的 PSwW 和 dev 《陷入 种 类 ) 之 后 ， 调 用 panic( ) 结束 
处 理 。 


19~21 case 语句 中 的 n+USER 表示 用 户 模 式 的 陷入 。USER 标 
志 位 在 第 8 行 被 设 定 。 如 果 是 总 线 错误 ， 则 将 工 设置 为 信号 种 类 
并 退出 switch 语句 。 


23~27 “发生 错 误 指 令 时 的 处 理 。 与 总 线 错误 相同 ， 将 工 设置 为 信 
号 种 类 并 退出 switch 文 。 如 果 引 发 错误 指令 的 指令 ( 即 
fuiword(pc-2)。pc 指向 触发 陷入 的 指令 的 下 一 个 指令 ) 为 
SETD ， 但 同时 却 并 没有 设 定 错误 指令 的 信和 号 

(u.u_signal[SIGINS] ) 时 ， 则 忽略 此 陷入 。SETD 为 C 编译 
器 插入 到 所 有 程序 起 始 位 置 的 指令 (代码 清单 5-17) 


代码 清单 5-17 SETD (ken/trap.c) 


1 #define SETD ©0170011 


29~39 ”发 生 错 误 指 令 、 断 点 /1 跟踪、iot、emt 时 ， 执 行 与 发 生 总 
线 错误 时 相同 的 处 理 。 


41~72 ”发 生 系统 调用 时 的 处 理 ， 下 文 会 对 此 做 详细 说 明 。 


74~76 “内核 进 程 触发 译 动 小 数 点 异 香 时 的 处 理 。 发 送信 号 后 随即 
退回 。 内 核 进 程 本 号 不 进行 浮动 小 数 点 运算 。 在 内 核 进 程 中 发 生 
了 浮动 小 数 点 异常 ， 则 表示 由 用 户 程 序 执行 的 浮动 小 数 点 运算 在 
执行 系统 调用 ， 并 切换 到 内 核 进程 后 触发 了 陷入 。 因 为 PDP-11/40 
似乎 无 法 在 正确 位 置 触 发 浮动 小 数 点 运算 的 异 般 ， 所 以 会 导致 这 
种 现象 的 发 生 (图 5-8) 。 


用 户 模式 


+ 
对 
4 于 
圳 


浮动 小 数 点 运算 -- 


图 5-8 内核 进程 中 发 生 浮 动 小 数 点 的 异常 
78~80 用户 进程 触发 浮动 小 数 点 异常 时 的 处 理 。 与 总 线 错 误 相 
同 ， 将 工 设置 为 陷入 种 类 并 退出 switch 语句 。 


82~88 ”用 户 进程 触发 段 异 单 时 的 处 理 。 由 于 异 音 的 原因 有 可 能 是 
栈 区 域 淤 出， 因此 首先 执行 backup( ) 恢复 触发 陷入 前 的 状态 ， 
0 全 尝试 扩展 栈 区域 。 正 是 此 处 的 处 理 实现 了 栈 区 域 


91 ”退出 switch 语句 后 的 处 理 。 执 行 psignal( ) 向 执行 进程 
发 送信 号 。 


94~95 ”如 果 收 到 信号 ， 则 进行 信号 处 理 。 此 前 通过 psignal() 
发 送 的 信和 号 在 此 处 立即 得 到 处 理 。 


96 ”执行 setpri()， 再 次 计算 进程 的 执行 优先 级 。 
grow!() 


grow( ) 用 来 扩展 用 户 进 程 栈 区 域 的 长 度 ( 表 5-22， 代 码 清 单 5-18 
) 。 参 数 为 位 于 用 户 空 间 中 的 新 的 栈 区 域 的 上 限 地 址 。 将 此 地 址 再 加 
上 20x64 字 节 即 是 新 的 栈 区 域 的 长 度 。 如 果 此 地 址 已 在 当前 栈 区 域 的 
范围 之 内 ， 则 不 做 任何 处 理 (图 5-9) 。 


图 5-9 grow0 
表 5-22 grow( 的 参数 


新 的 栈 区 域 的 地 址 


1 grow(sp) 
char *sp; 


register a, 


if(sp >= -u.u_ssize*64) 
return(0); 
si = ldiv(-sp, 64) - uU.u_ssize + SINCR; 
if(si <= 0) 
return(0); 
if(estabur(u.u_tsize, u.u_dsize, u.u_ssize+si, Uu.u_sep)) 
return(0); 
expand(u.u_procp->p_size+si); 
a = Uu.u_procp->p_addr + u.u_procp->p_size; 
for(i=u.u_ssize; i; i--) { 


a--, 
copyseg(a-si, a); 


for(i=si; i; i--) 
clearseg(--a); 

U.U_SSlize =+ Si; 

return(1); 


6~7 ”如 果 栈 区 域 已 经 足够 大 ， 则 不 做 任何 处 理 并 返回 。 请 注意 ， 
由 于 栈 区 域 的 地 址 从 0xffff 开始 ， 因 此 为 负 值 。 


8~10 ”计算 栈 需要 扩展 的 长 度 ， 并 检查 是 否 为 正 值 ， 如 果 不 是 则 
返回 ， 且 不 做 扩展 处 理 。SINCR 被 定义 为 20 (代码 清单 5-19) 。 


代码 清单 5-19 SINCR (param.h) 


1 #define SINCR 20 


11~12 ”执行 estabur() 更 新 用 户 APR。 

13 ”执行 expand() 扩展 数据 段 。 

14~20 ”移动 栈 区 域 ， 移动 的 距离 为 对 数据 段 进行 扩展 的 长 度 。 
21~22 ”更 新 栈 区 域 的 长 度 ， 返 回 1 表示 扩展 成 功 。 


5.6 ”系统 调用 的 处 理 流程 
传递 参数 的 方法 


如 前 所 述 ， 回 系统 调用 传递 参数 的 方法 ， 因 系统 调用 的 种 类 而 异 。 基 
本 上 是 通过 r6 ， 或 者 是 通过 在 trap 指令 (sys 指令 及 其 参数 ) 之 后 
指定 的 地 址 回 系统 调用 传递 参数 (代码 清单 5-20 ) 。 在 系统 调用 处 理 
函数 内 部 ， 对 前 者 通过 u,u_ar6f[] 、 对 后 者 通过 u,u_argf[] 访问 。 
此 外 也 存在 两 种 方式 并 用 的 情况 。 


代码 清单 5-20 系统 调用 执行 的 示例 


1 mov $1, ro 
2 sys sys_number1 / 通过 rg 传 递 参 数 


1 sys sys_number2 / 在 sys 指 令 的 后 面 
2 arg 


系统 调用 也 文 持 间接 执行 的 方式 。 编 号 为 0 的 系统 调用 用 来 间接 执行 
其 他 系统 调用 。 在 sys 指令 及 其 参数 (=0 ) 后 面 指定 数据 区 域 的 地 
址 ， 该 地 址 指向 实际 执行 系统 调用 的 指令 (代码 清单 5-21 ) 


代码 清单 5-21 系统 调用 间接 执行 的 示例 


1 .text 

2 sys 0; sys_call 
3 .data 
4 
5 


sys_call: 
Sys sys_number; sys_arg 


sysent 结构 体 


sysent 结构 体 保存 与 系统 调用 处 理 函 数 相 关 的 数据 (代码 清单 5- 
22， 表 5-23 ) 。 有 具体 来 说 ， 就 是 保存 着 参数 的 数量 ， 和 系统 调用 处 理 
阔 数 的 地 址 。 


代码 清单 5-22 sysent (ken/trap.c) 


1 struct sysent { 
2 int Count 

3 int (*call)(); 
4 } sysent[64]; 


表 5-23 sysent 结构 体 


参数 的 数量 


系统 调用 站 理 而 的 地 直 


内 核 提 供 的 系统 调用 ， 和 与 之 对 应 的 系统 调用 处 理 函 数 ， 都 是 由 
sysent[] 进行 管理 (代码 清单 5-23 ) 。sys 指令 的 参数 对 应 
sysent[] 的 下 标 。 


代码 清单 5-23 sysent[] (ken/sysent.c) 


1 int sysent[] 

2 

3 0, &nullsys, /* 0 = indir */ 

4 0, &rexit, /* 1 = exit */ 

5 ©0, &fork, /* 2 = fork */ 

6 2, &read, /* 3 = read */ 

7 2, &write, /* 4 = Write */ 

8 2, &open, /* 5 = open */ 

9 0, &close, /* 6 = close */ 
10 0, &wait, /* 7 = wait */ 
11 2, &creat, /* 8 = creat */ 
12 2, &link, /* 9 = link */ 
13 1, &unlink, /* 10 = unlink */ 
14 2, &exec, /* 11 = exec */ 
15 1, &chdir, /* 12 = chdir */ 
16 0, &gtime, /* 13 = time */ 
17 3, &mknod, /* 14 = mknod */ 
18 2, &chmod, /* 15 = chmod */ 
19 2, &chown, /* 16 = chown */ 
20 1, &sbreak, /* 17 = break */ 
21 2, &stat, /* 18 = stat */ 
22 2, &seek, /* 19 = seek */ 
23 0, &getpid, /* 20 = getpid */ 
24 3, &smount, /* 21 = mount */ 
25 1, &sumount, /* 22 = umount */ 
26 0, &setuid, /* 23 = setuid */ 
27 0, &getuid, /* 24 = getuid */ 
28 0, &stime, /* 25 = stime */ 
29 3, &ptrace, /* 26 = ptrace */ 
30 0，&nosys， /* 27 = x */ 

31 1, &fstat, /* 28 = fstat */ 
32 0, &nosys, /* 29= x */ 
33 1, &nullsys, /* 30 = smdate; inoperative */ 


34 1, &stty, /* 31 = stty */ 
35 1, &gtty, /* 32 = gtty */ 
36 0，&nosys， 1 3 三 

37 0，&nice， /* 34 = nice */ 
38 0, &sslep, /* 35 = Sleep */ 
39 0, &sync, /* 36 = sync */ 
40 1, &kill, /* 37 = kill */ 
41 0, &getswit, /* 38 = switch */ 
42 0，&nosys， 9 

43 0，&nosys， /* 40= x */ 

44 0, &dup, /* 41 = dup */ 
45 0, &pipe, /* 42 = pipe */ 
46 1, &times, /* 43 = times */ 
47 4, &profil, /* 44 = prof */ 
48 0，&nosys， /* 45 = tiu */ 
49 0, &setgid, /* 46 = setgid */ 
50 0, &getgid, /* 47 = getgid */ 
51 2, &ssig, /* 48 = sig */ 
52 0，&nosys， /* 49 = x */ 

53 0，&nosys， /* 50 = x */ 

54 0，&nosys， /D1 xX yy 

55 0，&nosys， /* “52 EX ty 

56 0，&nosys， 53“ ER 

57 0，&nosys， /* 54 = x */ 

58 0，&nosys， /DD Xx Sy 

59 0，&nosys， /* 56 = x */ 

60 0，&nosys， /57 SX 

61 0，&nosys， /* 58 = x */ 

62 0，&nosys， /* 59 = X */ 

63 0，&nosys， /* 60= x */ 

64 0，&nosys， /* 61 = x */ 

65 0，&nosys， /62 SY 

66 0, &nosys /* 63= x */ 

67 }; 


nullsys( ) 是 不 做 任何 处 理 的 函数 ， 被 赋予 用 于 间接 执行 的 
sysent[0] ， 实 际 上 不 会 被 任何 人 调用 (代码 清单 5-24 ) 。 执 行 
nosys() Sy 会 被 赋予 还 未 使 用 的 sysent[] 的 元 素 ( 代 
码 清单 5-25 ) 。 


代码 清单 5-24 nullsys() (trap.o) 


1 nullsys() 
2 


3 } 


代码 清单 5-25 nosys() (trap.a 


osys() 


u.u_error = 100; 


1n 
2 二 
3 

4} 


trap0 


eR 
清单 5-26 ) 。 


代码 清单 5-26 ”trap0 中 的 相应 处 理 (trap.c) 


41 case 6+USER: /* sys call */ 

42 U,U_error = 0; 

43 ps =& ~EBIT,; 

44 callp = &sysent[fuiword(pc-2)&077]; 
45 if (callp == sysent) { /* indirect */ 
46 a = fuiword(pc); 

47 pc =+ 2; 

48 i = fuword(a); 

49 if ((i & ~077) != SYS) 

50 i =: 077; /* illegal */ 
51 callp = &sysent[i&077]; 

52 for(i=0; i<callp->count; i++) 
53 u.u_arg[i] = fuword(a =+ 2); 
54 } else { 

55 for(i=0; i<callp->count; i++) { 
56 u.u_arg[i] = fuiword(pc); 
57 pc =+ 2; 

58 } 

59 } 

60 u.u_dirp = u.u_arg[0]; 

61 trapi(callp->call); 


62 if(u.u_intflg) 


63 u.u_error = EINTR; 


64 if(u.u_error < 100) { 
65 if(u.u_error) { 

66 ps =| EBIT; 

67 r9 = Uu.u_error,; 
68 } 

69 goto out; 

70 

71 i = SIGSYS,; 

72 break; 


41 ”发 生 系 统 调用 时 的 处 理 。 


42 重 置 Wu,.uU_ error 。 


43 | PSW[0]。EBIT 的 值 为 1 (代码 清单 
B207) 8 


代码 清单 5-27 EBIT (ken/trap.c) 


1 #define EBIT 1 


44 ”fuiword(pc-2) 表示 触发 陷入 的 指令 (=trap 指令 ) 
trap 指令 低位 6 比特 的 数字 代表 系统 调用 的 种 类 。 


45 ”间接 系统 调用 时 的 处 理 。 

46~50 ” 紧 跟着 trap 指令 的 下 一 个 地 址 中 存放 的 值 也 是 一 个 地 

址 ， 如 果 该 地 址 指向 的 数据 不 是 trap 指令 ， 则 将 工 设 定 为 077 
(nosys ) 。SYS 表示 trap 指令 (代码 清单 5-28) 


代码 清单 5-28 SYS (kenm/trap.c) 


1 #define SYS ©0104400 


| 


51 将 callp 设置 为 实际 执行 的 sysent[] 的 元 素 。 


52~53 ”将 Uu.u_arg[i] 赋予 位 于 trap 指令 后 方 传递 给 系统 调 
用 的 参数 。 


54 ”直接 系统 调用 时 的 处 理 。 


55~58 ”将 u.u_arg[] 赋予 位 于 trap 指令 后 方 传 递 给 系统 调用 
的 参数 。 


60 ”将 u.u_dirp 赋予 位 于 trap 指令 后 方 传递 给 系统 调用 的 参 
数 的 起 始 位 置 的 值 。u .u_dirp 用 于 在 系统 调用 处 理 函 数 内 部 取 
得 从 用 户 程序 传递 过 来 的 文件 路 径 名 。 


61~63 trap1() 用 来 执行 系统 调用 处 理 函 数 ( 表 5-24， 代 码 清 
单 5-29) 。 会 在 第 6 章 中 介绍 。 


表 5-24 trap10 的 参数 


系统 调用 处 理 函 数 的 地 址 


代码 清单 5-29 trap10 (ken/trap.c) 


1 trap1(f ) 

2 int (*f)(); 

3 1 

4 

5 uU.u_intflg = 1; 
6 savu(u.u_qsav); 
7 (*f)(); 

8 u.u_intflg = 0; 
9 } 


| 


64 u.u_error 不 为 EFAULT 时 的 处 理 。 未 发 生 错 误 时 这 里 的 
if 语句 的 值 为 真 。 如 果 U.u_error 为 EFAULT ， 与 发 生 总 线 错 
误 时 相同 ， 将 主 设 置 为 陷入 种 类 并 退出 Switch 语句 。 


65~68 ”如 果 U.u_error 被 赋予 了 错误 代码 ， 则 将 触发 陷入 的 进 
程 的 PSW[0] 设 为 1， 并 将 rg 设 定 为 u.u_error 的 值 。 执 行 系 
统 调用 的 程序 可 以 通过 PSW[0] 判断 系统 调用 中 是 否 发 生 了 错误 。 


69 ” 跳 转 至 out ， 对 信和 号 进行 处 理 并 再 次 计算 进程 优先 级 ， 然 后 
结束 系统 调用 。 


5.7 小 结 


。 由 于 某 种 原因 引发 中 断 和 陷入 后 ， 和 暂停 当前 处 理 ， 由 内 核 进程 执 
行 相 应 的 处 理 函 数 后 再 恢复 被 暂停 的 处 理 。 


中 断 是 对 周边 设备 提出 的 异步 中 断 请 求 进行 有 歼 处 理 的 机 制 。 
陷入 是 对 CPU 内 部 发 生 的 异常 进行 有 效 处 理 的 机 制 。 

系统 调用 是 用 户 程序 执行 内 核 功 能 的 手段 ， 利 用 陷入 实现 。 
S00 sysent[] 管理 。 通 过 sysent[0] 可 实现 间接 执 
0 


第 6 草 信号 
6.1 什么 是 信号 


信号 是 一 种 实现 进程 间 通 信 的 机 制 。 收 到 信和 号 的 进程 将 暂停 当前 执行 
的 内 容 ， 并 根据 信号 种 类 做 相应 的 处 理 。 根 据 信 号 暂停 当前 处 理 ， 并 


在 需要 时 恢复 的 特点 ， 可 视 为 中 断 的 一 种 。 
信号 可 实现 以 下 功能 。 
。 剥夺 用 户 进程 的 控制 权 
。 终止 用 户 进程 的 运行 
。 跟踪 用 户 进程 的 处 理 (trace) 
当 进 程 成 为 执行 进程 后 ， 会 检查 是 否 收 到 信号 ， 如 果 收 到 了 信和 号 则 调 


用 信和 号 处 理 函 数 (图 6-1 ) 。 进 程 也 可 以 选择 忽略 信号 ， 或 执行 独自 定 
义 的 信号 处 理 函 数 。 


进程 1 进程 2 时 间 
通过 系统 调用 signal ' 
设 定 user.u_signal[n] ' 
~ 
~ 
1 
发 送信 号 
| swtch!() sleep!) 
接收 信号 时 的 ' 
检查 和 处 理 
1 


图 6-1 信和 号 处 理 流程 
信和 号 的 发 送 方法 


用 户 进 程 执行 系统 调用 Ki11 后 ， 即 可 向 其 他 进程 发 送信 号 。 此 外 ， 
也 可 以 通过 终端 发 送信 号 。 


对 于 收 到 信号 的 进程 ，proc,.p_sig 会 被 设 为 代表 信和 号 种 类 的 数值 。 
如 果 处 理 信 号 前 又 接收 到 了 新 的 信号 , 旧 的 信号 将 被 覆盖 。 但 是 ， 用 于 
强制 结束 的 SIGKIL 却 不 会 被 覆盖 。 


最 近 的 操作 系统 一 般 将 信号 作为 比特 向 量 处 理 ， 因 此 即使 收 到 新 的 信 
号 也 不 会 履 兰 旧 的 信号 。 


确认 接收 信号 


内 核 进 程 会 在 下 述 处 理 中 确认 是 否 收 到 了 信号。 如 有 果 收 到 ， 则 执行 信 
号 处 理 函 数 。 


。 proc.p_pri 大 于 等 于 0， 并 准备 进入 休眠 状态 时 

。 有 时钟 中 断 处 理 函 数 以 每 秒 1 次 的 频率 确认 

。 陷入 处 理 函 数 
执行 进程 之 外 的 进程 无 法 确认 是 否 收 到 了 信号 ， 也 就 是 说 ， 即 使 向 某 
个 进程 发 送 了 信和 号， 也 不 能 保证 对 方 会 立即 进行 处 理 。 只 有 当 该 进程 
变 为 执行 进程 后 才 会 处 理 信号 。 这 一 点 与 周边 设备 引发 的 中 断 相 比 有 
很 大 不 同 。 
信和 号 的 种 类 


信号 具有 多 个 种 类 。 虽 然 现 在 在 其 他 操作 系统 中 可 以 设 定 多 达 20 种 的 
信号 ， 但 是 UNIX V6 只 定义 了 13 种 (代码 清单 6-1, 表 6-1) 。 


代码 清单 6-1 信和 号 (param.h) 


1 #define NSIG 20 
2 #define SIGHUP 1 
3 #define SIGINT 2 
4 #define SIGQIT 3 
5 #define SIGINS 4 
6 #define SIGTRC 5 
7 #define SIGIOT 6 
8 #define SIGEMT 7 
9 #define SIGFPT 8 
10 #define SIGKIL 9 


11 #define SIGBUS 10 


12 #define SIGSEG 11 
13 #define SIGSYS 12 
14 #define SIGPIPE 13 


表 6-1 信号 的 种 类 


so | 人 


执行 输入 输出 陷入 指令 
执行 模拟 指令 
浮动 小 数 点 计算 的 异常 


SIGSYS(12) 对 系统 调用 指定 了 错误 参数 


SIGPIPE(13) 


通过 赋值 user .u_signal[n] (n 代表 信号 的 种 类 ) ， 可 选择 名 略 
该 信号 ， 或 执行 独自 定义 的 信号 处 理 函 数 。user,.u_signal[n] 的 值 
与 收 到 信和 号 后 进行 的 处 理 之 间 的 关系 如 表 6-2 所 示 。 


表 6-2 设 定 user.u_signal[] 


mnie 


(信号 处 理 函 数 的 地 址 1 ) 到 进程 执行 指定 的 处 理 函 数 


pp 


于 PDP-11/40 中 的 指令 以 字 为 单位 〈 偶 数字 节 单 位 ) 对 齐 ， 因 此 函数 的 地 址 一 定 为 偶数 。 


但 是 ，n=9 的 SIGKIL 比较 特殊 。 进程 无 法 忽略 SIGKIL 或 执行 独自 
定义 的 处 理 函 数 。 收 到 SIGKIL 的 进程 必须 结束 自身 的 处 理 ， 因 此 ， 
user .u_signal[9] 的 值 始终 为 0。 


用 户 进 程 通过 执行 系统 调用 signal 可 以 设 定 user,u_signalr] 的 
值 。 


ssig() 
ssig( ) 为 系统 调用 signal 的 处 理 函 数 ( 表 6-3， 代 码 清单 6-2) 。 


执行 此 函数 将 改变 u,u_signalr] 的 值 。 
表 6-3 系统 调用 signal 的 参数 


代码 清单 6-2 ssig() (ken/sys4.c) 


ssig() 
{ 8 
register a; 
a= u.u_arg[90]; 
if(a<=0 || a>=NSIG || a ==SIGKIL) { 
u.u_error = EINVAL.; 
return; 


‘OOONOOORRODP 


U.Uu_arO[RO] = u.u_signal[al]; 


u.u_signal[a] = u.u_arg[1]; 
if(u.u_procp->p_sig == a) 
Uu.u_procp->p_sig = 0; 


5~9 ”信号 的 种 类 小 于 等 于 0， 或 大 于 等 于 NSIG (20)， 或 等 于 
SIGKIL (9) 时 判断 为 出 错 。 


10 ”将 当前 u.u_signal[al] 的 值 保 存 于 用 户 进程 的 r6 ， 此 数 
值 将 成 为 系统 调用 signal 的 返回 值 。 


11 将 u.u_signal[al] 设置 为 由 参数 指定 的 值 。 


12~13 “如果 执行 中 的 进程 在 此 之 前 已 经 收 到 了 与 刚刚 设 定 的 
u.u_signal[a] 相对 应 的 信号 ， 则 将 该 信号 清除 。 此 处 大 概 古 
开发 者 认为 接收 信号 时 的 处 理 已 经 发 生 了 变化 ， 需 要 重 置 。 


kil0 


kil1( ) 为 系统 调用 kill 的 处 理 画 数 ( 表 6-4， 代 码 清单 6-3) 。 通 
过 psignal( ) 向 用 户 程序 指定 的 进程 ID 相对 应 的 进程 发 送信 号 ， 但 
是 无 法 对 自己 发 送信 号 。 此 外 ， 超 级 用 户 以 外 的 用 户 ， 如 果 发 送 与 接 
收 的 进程 不 具备 相同 的 实效 DID (参见 第 9 章 ) ， 也 是 天 法 发 送信 
当 指 定 的 进程 ID 为 0 时 ， 向 与 执行 进程 位 于 同一 终端 、 除 proc[9] 
和 proc[1] 之 外 的 所 有 进程 发 送信 号 。 如 果 对 象 进程 不 存在 ， 则 会 引 
发 错误 。 昌 然 名 为 kill ， 但 不 只 是 发 送 SIGKIL 那么 简单 。 


表 6-4 系统 调用 kill 的 参数 


信和 号 针对 的 进程 ID。 如 果 r0 为 0， 则 对 象 包括 除 ID 为 0、1 的 进程 之 


外 的 所 有 进程 


ro 
信号 的 种 类 


代码 清单 6-3 kill0 (ken/sys4.c) 


il1() 


k 


register struct proc *p, *q; 
register a; 
int f; 


ONOORODP 


/ 
.U_arQO[RO]; 


9 q = u.u_procp; 


10 for(p = &proc[0]; p < &proc[NPROC]; p++) { 
11 if(p == 

12 continue; 

13 if(a != 0 && p->p_pid != a) 

14 continue; 

15 if(a == 0 && (p->p_ttyp != 9q->p_ttyp || p <= &proc[1])) 
16 continue; 

17 if(uyu.u_uid != 0 && uU.uUuid != p->p_uid) 
18 continue; 

19 f++; 

20 psignal(p, u.u_arg[0]); 

21 } 

22 if(f == 0) 

23 U,.U_error = ESRCH; 

24 } 


signal() 

signal( ) 通过 执行 psignal( ) ， 问 与 执行 进程 位 于 同一 终端 的 所 
有 进程 发 送信 号 ( 表 6-5， 代 码 清单 6-4 ) 。signal( ) 由 终端 的 中 断 
处 理 函 数 运行 。 


表 6-5 signal0 的 参数 


tty 结构 体 (参见 第 13 


sig 证 号 的 种 类 


ignal(tp, sig) 


1 
2 
3 register Struct proc *p; 
4 


5 for(p = &proc[0]; p < &proc[NPROC]; p++) 
6 if(p->p_ttyp == tp) 

7 psignal(p, sig); 

8 } 


psignal() 


psignal( ) 回 指定 的 进程 发 送信 号 ( 表 6-6， 代 码 清 单 6-5) 。 但 
是 ，SIGKIL 信和 号 不 会 被 履 盖 。 


表 6-6 ”psignal( 的 参数 


代表 对 象 进程 的 元 素 


信号 的 种 类 


代码 清单 6-5 psignal() (ken/sig.c) 


1 psignal(p, sig) 


2 int *p; 

3 1 

4 register *rp; 

5 

6 if(sig >= NSIG) 

7 return; 

8 rp = py， 

9 if(rp->p_sig != SIGKIL ) 
10 rp->p_sig = sig; 
11 if(rp->p_stat > PUSER) 
12 rp->p_stat = PUSER; 
13 if(rp->p_stat == SWAIT) 
14 setrun(rp); 


| 


11~12 ”此 处 疑 为 Bug， 处 理 对 象 的 变量 不 应 为 proc.p_stat ， 
而 应 是 proc.p_pri。 开 发 者 的 意图 应 该 是 使 执行 优先 级 保持 一 
个 定 值 ， 从 而 使 信号 更 容易 处 理 。 


13~14 ”如 果 对 象 进程 的 状态 为 SWAIT 并 处 于 睡眠 之 中 ， 将 其 唤 
醒 并 促使 其 进行 信号 处 理 。SWAIT 在 进程 调用 sleep( ) 时 进入 
睡眠 状态 ， 且 proc.p_pri 大 于 等 于 0 时 被 设 定 。 进 程 被 唤醒 并 
通过 swtch( ) 成 为 执行 进程 后 ， 在 sleep( ) 内 将 对 是 否 收 到 信 
号 进行 确认 。 


issig() 


issig() 用 来 确认 执行 进程 是 否 收 到 了 信号 〈 代 码 清单 6-6) 。 当 
user.u_signal[n] (n 表示 信号 的 种 类 ) 被 设 为 奇数 时 ， 和 忽略 该 信 
= 


代码 清单 6-6 issig() (ken/sig.c) 


issig() 
{ 
register n; 
register struct proc *p; 


p= u.u_procp; 
if(n = p->p_sig) { 
if (p->p_flag&STRC) { 
stop(); 
if ((n = p->p_sig) == 0) 
return(0); 


} 
if((u.u_signal[n]&1) == 0) 
return(n); 


return(0); 


7 收 到 信号 时 的 处 理 。 
8~12 ”与 跟踪 功能 相关 的 处 理 。 在 后 文中 将 对 其 进行 说 明 。 


13~14 如果 u.u_signal[n] (n=proc.p_sig) 的 值 为 偶数 ， 则 
返回 n。 


16 ”如 有 果 没 有 收 到 信号 ， 或 是 需要 忽略 信号 时 返回 0。 


psig() 


psig( ) 进行 与 执行 进程 的 proc.p_sig 相对 应 的 信号 处 理 (代码 清 
单 6-7 ) 。 当 内 核 进 程 通过 issig() 进行 的 检查 结果 为 真 时 被 调用 。 


如 果 user .u_signal[n] 的 值 为 偶数 ， 执 行 由 该 值 指向 的 信号 处 理 
函数 。 首 先 将 用 户 进程 的 PSW、pc 的 当前 值 压 入 用 户 进程 的 栈 的 顶 
部 ， 并 将 栈 指针 指向 存放 pc 的 位 置 ( 表 6-7 ) 。 然 后 清除 用 户 进程 
PSW 的 陷入 位 (trap bit) ， 并 将 pc 设 定 为 信号 处 理 函 数 的 地 址 。 信 和 号 
处 理 函 数 在 控制 权 返 回 用 户 进 程 后 被 执行 。 信 号 处 理 画 数 由 rtt 或 
rti 指令 终止 。rtt 和 rti 指令 从 栈 顶部 恢复 pc 和 PSW 的 值 ， 随 后 
被 暂停 的 进程 将 继续 原 有 的 处 理 。 


表 6-7 用 户 栈 的 状态 


被 中 断 的 进程 的 pc 


' 断 的 进程 的 PSW 


被 中 断 的 进程 的 栈 的 顶 首 


如 果 user.u_signal[n] 的 值 为 0， 则 终止 进程 。 根 据 信 号 的 种 类 可 
以 输出 调试 用 的 core 文件 。 最 后 将 用 户 进程 的 rg 的 值 、 信 号 的 种 
类 、 是 否 生 成 了 core 文件 等 信息 作为 结束 状态 通知 父 进程 。 


代码 清单 6-7 psig() (ken/sig.o) 


psig() 

{ 
register n, p; 
register *rp; 


rp = u.u_procp; 
n = rp->p_sig, 
rp->p_sig = 0; 
if((p=u.u_signal[n]) != 0) { 
u.u_error = 0; 
if(n != SIGINS && != SIGTRC) 
u.u_signal[n] 0; 
n= Uu.u_arO[R6] - 4; 
grow(n); 
suword(n+2, u.u_arO[RPS]); 
suword(n, u.u_arO[R7]); 
U.Uu_arQO[R6] = n; 
U.uUu_arQO[RPS] =& ~TBIT; 
uU.u_arQO[R7] = p; 
return; 


OOONOOORODP 


switch(n) { 


case SIGQIT: 
case SIGINS: 
case SIGTRC: 
case SIGIOT: 
case SIGEMT: 
case SIGFPT: 
case SIGBUS: 
case SIGSEG: 
case SIGSYS: 
u.u_arg[0] = n; 
if(core()) 
n =+ 0200; 


} 
u.u_arg[0] = (u.u_arO[RO]<<8) | n; 
exit(); 


9 user.u_signal[n] 被 设 定 为 独 目 定 义 的 信号 处 理 函 数 地 址 
时 的 处 理 。 


14 ”为 了 安全 起 见 ， 执 行 grow( ) 扩展 用 户 进程 的 栈 区 域 。 

22 Uu.u_signal[n] 被 设 定 为 0 时 的 处 理 。 

35 ”如 果 生 成 了 core 文件 ， 则 将 n 的 第 7 比特 位 设置 为 1。 

37 ”将 u.u_arg[9] 的 高 位 8 比特 设 定 为 用 户 进程 的 rg 的 值 ， 
低位 8 比特 设 定 为 表示 信号 种 类 以 及 是 否 生 成 了 core 文件 的 信 
息 。u.u_arg[9] 作为 结束 状态 通知 父 进程 。 

38 ”执行 exit() ， 使 进程 结束 自身 的 处 理 。 


core() 


core( ) 在 当前 目录 下 生成 名 为 core 的 文件 (代码 清单 6-8 ) 。 文 件 
包括 数据 段 的 全 部 内 容 (PPDA、 数 据 区 域 、 栈 区 域 ) 。 用 户 可 以 通过 
仿 查 该 文件 调试 程序 。 


在 第 1 章 中 介绍 了 内 存 也 可 以 被 称 为 Core。 此 处 的 core( ) 进行 的 处 
理 通常 被 称 作 内 核 转 储 (Core Dump) 


代码 清单 6-8 core() (ken/sig.c) 


1 core() 

2 

3 register s, *ip; 

4 extern schar; 

5 

6 U,U_error = 0; 

7 u.u_dirp = "core"; 

8 ip = namei(&schar, 1); 

9 if(ip == NULL) { 

10 if(u.u_error) 

11 return(0); 

12 ip = maknode(0666 ) ; 

13 if(ip == NULL) 

14 return(0); 

15 } 

16 if(!access(ip, IWRITE) && 
17 (ip->i_ mode&IFMT) == 0 && 
18 U.U_UuUid == U,U_ruid) { 


19 itrunc(ip); 


20 u.u_offset[0] = 0; 

21 u.u_offset[1] = 0; 

22 U.U_base = &u; 

23 U.U_count = USIZE*64; 
24 u.u_segflg = 1; 

25 writei(ip); 

26 Ss = Uu.u_procp->p_size - USIZE; 
27 estabur(0, s, 0, 0); 
28 U.U_base = 0，; 

29 U.U_count = s*64; 

30 u.u_segflg = 0; 

31 writei(ip); 

32 } 

33 iput(ip); 

34 return(u.u_error==0); 

35 } 


在 系统 调用 处 理 中 处 理 信和 号 
UNIX V6 在 系统 调用 处 理 中 如 果 处 理 了 信和 号， 将 引发 EINTR 错误 。 此 
言 号 时 的 进程 状态 ， 用 户 根 据 需 要 可 以 再 次 执行 系统 调 


人 trap1() 的 代码 如 下 所 示 (代码 清单 6- 
9 oO 


代码 清单 6-9 trap10 中 的 相关 代码 (ken/trap.c) 


trap1i(f) 
int (*f)(); 
{ 


u.u_intflg = 1; 


savu(u.u_qsav); 
(*f)(); 
u.u_intflg = 0; 


trap1() 首先 设 定 u.u_intflg ， 在 u.,u_qsav 中 保存 r5、r6 的 当 
前 值 ， 然 后 执行 通过 参数 取得 的 系统 调用 处 理 画 数 。 执 行 完毕 后 重 置 
u.u_intflg 并 返回 。 


因为 u.u_intflg 被 重 置 ， 所 以 在 trap( ) 中 不 会 发 生 EINTR 错误 
(代码 清单 6-10) 。 


代码 清单 6-10 ”trap0 中 的 相关 代码 (kem/trap.c) 


trapi(callp->call); 
if(u.u_intflg) 


u.u_error = EINTR; 


因为 系统 调用 处 理 中 已 经 适度 提高 了 处 理 塘 优先 级 ， 所 以 对 终端 的 输 
入 不 会 引发 中 断 处 理 。 在 系统 调用 处 理 中 能 够 引发 信号 处 理 的 只 有 这 
种 情况 ， 即 系统 调用 处 理 函 数 执行 sleep( ) 中 断 自 喘 运 行 后 ， 执 行进 
程 切换 至 其 他 进程 ， 而 后 着 同 前 着 发 送 了 信号。 


通常 ， 在 读 取 文 件 等 情况 下 会 将 执行 优先 级 设 为 负 值 并 进入 睡眠 状 
态 ， 此 时 信和 号 将 被 名 略 。 而 例如 终端 处 理 等 对 处 理 速 度 较 慢 的 设备 执 
行 系统 调用 read 、write 或 wait 时 ， 有 可 能 在 系统 调用 处 理 函 数 
中 将 执行 优先 级 设 为 大 于 或 等 于 0 的 值 并 进入 睡 眼 状态 。 只 有 在 这 种 
情况 下 有 可 能 发 生 对 信和 号 的 处 理 。 


收 到 信号 时 ， 会 在 sleep( ) 中 将 其 检 出 (代码 清单 6-11) 。 
sleep() 执行 aretu(u.u_qsav) 后 ， 将 从 trap1() 返回 处 继续 进 
行 处 理 。 此 时 因为 u.u_intflg 未 被 重 置 ， 所 以 在 trap() 中 将 发 生 
EINTR 错误 。 


代码 清单 6-11 ”sleep0 中 的 相关 代码 (ken/slp.c) 


1 sleep(chan, pri) 
2 


(中 上 略 ) 


8 if(pri >= 0) { 

9 if(issig() ) 

10 goto psig 

(中 上 略 ) 
20 swtch( ); 
21 if(issig()) 
Sp goto psig; 
23 } else { 
(中 上 略 ) 

34 psig: 
35 aretu(u.u_qsav); 


6.2 ”跟踪 功能 


什么 是 跟 踩 


当 子 进程 处 理 (由 断 点 陷入 触发 的 ) 信 号 时 ， 跟 躁 功 能 提供 了 一 种 使 
父 进程 能 够 介入 子 进程 处 理 的 机 制 。 通 过 系统 调用 ptrace ， 可 以 操 
作 子 进程 的 数据 。 跟 路 功能 通 闸 供 调试 右 等 使 用 。 


ipc 结构 体 
ipc (inter process communication) 结构 体 是 供 跟踪 功能 使 用 的 全 局 结 


构 体 (代码 清单 6-12， 表 6-8 ) 。 父 进程 通过 执行 系统 调用 ptrace 
， 可 以 将 对 子 进程 的 请 求 保 存在 ipc 结构 体 中 。 


代码 清单 6-12 ”ipc 结构 体 (ken/sig.c) 


1 struct 

2 

3 int ip_lock; 
4 int ip_req; 
5 int ip_addr; 
6 int ip_data; 
7 } ipc 


| 


表 6-8 ipc 结构 体 


跟踪 的 处 理 流 程 
子 进 程 执行 系统 调用 ptrace 设 定 STRC 标志 位 。STRC 标志 位 表明 当 


前 进程 为 跟踪 对 象 进 程 。 


如 果子 进程 在 设置 了 STRC 标志 位 的 情况 下 进行 信号 处 理 ， 则 会 进入 
SSTOP 状态 ， 控 制 权 会 转移 至 父 进 程 。SSTOP 状态 表明 当前 进程 正在 
等 待 父 进 程 进行 介入 处 理 。 


在 系统 调用 wait 的 处 理 范 数 中 ， 如 末 父 进程 发 现 了 处 于 SSTOP 状态 
的 子 进程 ， 会 将 子 进程 的 SWTED 标志 位 置 1。 


此 时 控制 权 会 暂时 交还 给 用 户 进程 。 父 进程 如 果 执 行 系统 调用 ptrace 

将 清除 SWTED 标志 ， 并 可 以 把 对 ipc 结构 体 。 如 
果 父 进程 没有 执行 pt race ， 而 是 再 次 执行 系统 调用 wait 并 试图 将 
控制 权 交 给 子 进程 ，SWTED 标志 将 保持 为 1 的 状态 ， 系统 以 此 判断 父 
进程 无 意 介 入 子 进 程 处 理 ， 因 此 将 结束 跟踪 处 理 。 


控制 权 转 交 给 子 进 程 后 ， 了 于 进程 根据 ipc 结构 体 的 值 进行 相应 处 理 。 
子 进程 或 是 等 竺 父 进程 的 再 次 介入 ， 或 是 返回 一 般 处 理 。 


跟 踩 处 理 的 流程 如 图 6-2 所 示 。 


父 进程 子 进 程 
通过 系统 调用 ptrace 
设置 STRC 标 志 位 
系统 调用 wait 
本 return 1 
issig()、Sstop() 
wait() 如 果 设 置 了 STRC 标 志 位 ， 那 
寻找 处 于 SSTOP 状态 么 子 进程 将 会 设置 为 SSTOP 
的 子 进程 ， 并 对 其 设置 状态 ， 并 唤醒 父 进程 
SWTED 标志 位 
| return 0 
通过 系统 调用 ptrace 
清除 子 进 程 的 SWTED 


标志 位 ， 并 把 对 子 进 

程 的 请 求 赋予 ipc 结 构 

体 ; 证 大 全 眼 状 看 
根据 ipc 结 构 体 的 值 进行 相应 处 理 

图 6-2 ”跟踪 处 理 流程 图 


stop() 

stop( ) 将 进程 设置 为 SSTOP 状态 (代码 清单 6-14 ) 。 设 置 后 ， 进 程 
在 收 到 信号 ， 并 开始 对 其 进行 相应 处 理 时 将 通知 父 进程 ， 父 进程 也 可 
以 对 于 进程 发 送 指令 。 


当 进 程 的 跟踪 标志 位 (STRC ) 为 1 时 ， 0 由 issig() 调用 

(代码 清单 6-13 ) 。issig( ) 在 执行 stop() 后 会 检查 是 否 设置 了 
proc.p_sig 的 值 ， 如 果 未 设置 则 返回 0。 这 应 该 是 考虑 到 stop ) 
处 理 中 信号 有 可 能 被 清除 而 采取 的 措施 。 


代码 清单 6-13 issig(0) 中 的 相关 代码 (ken/sig.c) 


if (p->p_flag&STRC) { 
stop(); 
if ((n = p->p_sig) == 0) 


return(0); 


代码 清单 6-14 stop() 中 的 相关 代码 (ken/sig.c) 


top() 


register struct proc *pp, *cp; 


s 
{ 


loop: 

cp = u.u_procp; 

if(cp->p_ppid != 1) 

for (pp = &proc[0]; pp < &proc[NPROC]; pp++) 

if (pp->p_pid == cp->p_ppid) { 
wakeup (pp); 
cp->p_stat = SSTOP; 
swtch( ); 
If ((cp->p_ flag&STRC)==0 || procxmt()) 
return 

goto 1oop 


OOONOOORODP 


exit(); 


} 


7~11 ”如 果 父 进程 不 是 jnit 进程 ， 唤 醒 父 进程 并 将 执行 进程 设 
置 为 SSTOP 状态 。 


12 ”执行 swtch( ) 切换 执行 进程 并 期 符 能 够 切换 至 父 进 程 。 当 
前 进程 若 希 望 再 次 成 为 执行 进程 ， 必 须 由 父 进程 将 其 设 定 为 SRUN 
状态 。 

13~15 ”当前 进程 再 次 成 为 执行 进程 时 的 处 理 。 如 果 跟 踪 处 理 已 结 
束 ， 或 是 procxmt( ) 的 处 理 结果 为 真 时 ， 执 行 return 并 返回 


一 般 处 理 。 人 否则 将 继续 循环 ， 以 促使 父 进程 再 次 介入 子 进 程 的 处 
理 。 


17 ”如果 没有 发 现 父 进程 ， 或 父 进程 为 init 进程 时 则 认为 发 生 异 
常 ， 调 用 exit() 终止 进程 。 


ptrace() 

ptrace( ) 是 系统 调用 ptrace 的 处 理 函 数 ( 表 6-9， 代 码 清单 6-15 

) ， 向 作为 跟踪 对 象 的 子 进程 发 出 指令 进行 处 理 。 父 进程 和 子 进程 通 

过 ipc 结构 体 通 信 。 

子 进程 也 可 以 利用 系统 调用 ptrace 将 自身 的 STRC 标志 位 设置 为 1。 
表 6-9 ”ptrace( 的 参数 


设 定 ipc.ip_data 的 值 


Case 
设 定 ipc.ip_addr 的 值 


指令 的 种 类 。0 与 其 他 数字 的 含义 不 同 ， 表 示 子 进程 正 被 父 进程 跟踪 


代码 清单 6-15 ptrace() (ken/sig.c) 


trace( ) 


p 
下 


register Struct proc *p; 


If (u.u_arg[2] <= 0) { 
Uu.u_procp->p_flag =| STRC; 
return; 

} 

for (p=proc; p < &proc[NPROC]; p++) 
if (p->p_stat==SSTOP 

&& p->p_pid==u.u_arg[0] 
&& p->p_ppid==u.u_procp->p_pid) 
goto found; 

U,.U_error = ESRCH; 

return; 


found: 
while (ipc.ip_lock) 
sleep(&ipc, IPCPRI); 
ipc.ip_lock p->p_pid; 
ipc.ip_data u.u_arQO[RO]; 
ipc.ip_addr u.u_arg[1] & ~01; 
ipc.ip_req = u.u_arg[2]; 
p->p_flag =& ~SWTED; 
setrun(p); 
while (ipc.ip_req > 0) 
sleep(&ipc, IPCPRI); 
U.U_ar0[R9] = ipc.ip_data; 
If (ipc.ip_req < 0) 
U.U_error = EIO; 
ipc.ip_ lock = 0; 
wakeup(&ipc); 


5~8 ”如 果 表 示 跟 踪 指 令 种 类 的 参数 小 于 或 等 于 0， 则 将 执行 进程 
的 跟踪 标志 位 STRC 置 1 并 返回 。 


9~15 ”寻找 满足 下 壕 条 件 的 进程 ， 找 到 后 跳 转 到 found 。 
。 处 于 SSTOP 状态 
。proc.p_pid 与 系统 调用 ptrace 的 参数 值 相同 


。 执行 进程 的 子 进 程 
18~19 ”找到 跟 踩 对象 进程 时 的 处 理 。 首 先 尝试 取得 ipc 结构 体 
的 锁 ， 如 采 无 法 取得 则 进入 睡眠 状态 。 


20~24 ”如 果 成 功 取 得 锁 ， 设置 ipc 结构 体 的 参数 ， 并 解除 跟踪 
对 象 进程 的 SWTED 标志 位 。 


25 ”执行 setrun()， 设 定子 进程 的 状态 为 SRUN。 此 时 子 进 程 
的 SSTOP 状态 被 解除 ， 成 为 可 执行 状态 。 

26~27 “进入 睡眠 状态 直至 ipc .ip_req 小 于 或 等 于 0。 由 子 进 
程 执行 的 procxmt( ) 会 把 ipc.ip_req 设 为 0。 


28 ” 当 procxmt() 由 了 于 进程 执行 完毕 ， 且 当前 进程 通过 
swtch( ) 被 选 为 执行 进程 后 ， 将 rg 设 为 ipc,ip_data ， 并 将 
其 作为 系统 调用 ptrace 的 返回 值 。 


29~30 ipc.ip_req 的 值 小 于 0 时 按 出 错 处 理 。 如 果 
procxmt() 在 处 理 中 出 错 ， 会 将 ipc .ip_req 设置 为 小 于 0 的 
值 。 


31~32 ”最 后 解除 ipc 结构 体 的 锁 ， 并 唤醒 正在 等 竺 同一 把 锁 的 
其 他 进程 。 


procxmt() 


procxmt( ) 由 被 跟踪 的 子 进程 执行 代码 清单 6-16 ) 。 根 据 由 父 进 
Be ptrace 设 定 的 ipc 结构 体 进 行 读 写 数据 等 处 理 
6-10 ) 。 


表 6-10 ipcip_req 


于 子 进 程 地 址 空间 的 数 


读 取 位 于 子 进程 地 址 空间 的 数据 。 只 有 当代 码 段 和 数据 段 分 别 由 不 同 的 
APR 进行 管理 时 才 被 使 用 ， 因 此 在 PDP-11/40 的 环境 下 未 被 使 用 


读 取 PPDA 的 数据 
人 


向 子 进程 地 址 空间 写 入 数据 。 只 有 当代 码 段 和 数据 段 分 别 由 不 同 的 APR 
进行 管理 时 才 被 使 用 ， 因 此 在 PDP-11/40 的 环境 下 未 被 使 用 


om 
“oo 


终止 子 进程 


代码 清单 6-16 procxmt0 (ken/sig.c) 


1 procxmt() 

2 1 

3 register int i; 
4 register int *p; 
5 

6 if (ipc.ip_lock != u.u_procp->p_pid) 
7 return(0); 

8 i = ipc.ip_req; 
9 ipc.ip_req = 0; 
10 wakeup(&ipc); 

11 

12 switch (i) { 

13 


14 case 1: 


if (fuibyte(ipc.ip_addr) == -1) 
goto error,; 

ipc.ip_data = fuiword(ipc.ip_addr); 

break; 


case 2: 
if (fubyte(ipc.ip_addr) == -1) 
goto error,; 
ipc.ip_data = fuword(ipc.ip_addr); 
break; 


case 3: 
i = ipc.ip_addr; 
if (i<0 || i >= (USIZE<<6)) 
goto error,; 
ipc.ip_data = u.inta[i>>1]; 
break; 


case 4: 
if (suiword(ipc.ip_addr, 0) < 0) 
goto error,; 
suiword(ipc.ip_addr, ipc.ip_data); 
break; 


case 5: 
if (suword(ipc.ip_addr, 0) < 0) 
goto error 
suword(ipc.ip_addr, ipc.ip_data); 
break; 


case 6: 
p = &u.inta[ipc.ip_addr>>1]; 
If (p >= u.u_fsav && p < &u. 
sav[25]) 
goto ok; 
for (i=0; i<9; i++) 
if (p == &u.u_arO[regloc[i]]) 
goto ok; 
goto error,; 
ok: 
If (p == &u.u_arO[RPS]) { 
ipc.ip_data =| 0170000; 
ipc.ip_data =& ~0340; 


*p = ipc.ip_data; 
break; 


case 7: 
u.u_procp->p_sig = ipc.ip_data; 
return(1); 


65 Case 8: 


66 exit(); 

67 

68 default: 

69 error: 

70 ipc.ip_req = -1; 
71 } 

72 return(0); 

73 } 


6~7 “如 果 锁 没有 被 正确 取得 则 退出 处 理 。 此 处 期 待 锁 由 
ptrace() 取得 。 


9~10” 重 置 ipc.ip_req ， 并 唤醒 因 执 行 ptrace( ) 并 等 得 
procxmt () 执行 结束 而 处 于 睡眠 状态 的 进程 。 


12~72 ”根据 由 父 进程 设 定 的 ipc ,ip_req 进行 各 种 处 理 。 如 果 
ipc.ip_req 的 值 为 7， 则 辣子 进 程 发 送信 号 并 返回 1， 然 后 继续 
子 进程 的 一 般 处 理 。 如 果 值 为 8， 则 执行 exit() 强制 终止 进程 的 
。 如果 为 其 他 值 则 返回 0， 再 次 促使 父 进程 介入 子 进程 的 处 


walit() 
wait( ) 中 与 跟踪 相关 的 处 理 如 下 所 示 (代码 清单 6-17 ) 。 
代码 清单 6-17 wait() 中 的 相关 代码 (ken/sys1.c) 


32 if(p->p_stat == SSTOP) { 

33 if((p->p_flag&SWTED) == 0) { 

34 p->p_flag =| SWTED; 

35 u.u_arO[RO] = p->p_pid; 

36 u.u_arQO[R1] = (p->p_sig<<8) | 0177; 
37 return; 

38 } 

39 p->p_flag =& ~(STRC|SWTED); 


40 setrun(p); 
} 


| 


33~38 ”如 采 未 设置 SWTED 标志 位 ， 则 将 其 设置 为 1。 将 用 户 进 
程 的 rg 设置 为 子 进 程 的 proc.p_pid ， 将 rd 的 高 位 8 比特 设 
置 为 proc,p_psig ， 低 位 8 比特 设置 为 0177， 随 后 返回 。 同 时 
可 以 期 待 一 下 此 后 的 执行 进程 将 执行 系统 调用 ptrace 。 


39~40 “如 果 在 34 行 设 定 的 SWTED 标志 位 此 时 仍 为 1〈 即 父 进程 
没有 通过 执行 系统 调用 ptrace 介入 子 进程 的 处 理 ， 再 次 执行 了 
系统 调用 wait ) ， 表 明 父 进程 无 意 跟 踪 子 进程 的 处 理 ， 因 此 将 
停止 跟 味 。 解 除 STRC 和 SWTED 标志 位 ， 使 子 进程 进入 可 执行 状 


6.3 小结 
。 信 号 是 一 种 实现 进程 间 通信 的 机 制 。 


。 收 到 信和 号 的 进程 将 暂停 一 般 处 理 ， 根 据 信 号 的 种 类 进行 相应 的 处 
理 。 因 此 可 以 认为 信号 属于 中 断 的 一 种 。 


。 与 周边 设备 发 生 的 中 断 不 同 ， 信 号 完全 是 由 软件 实现 的 。 
。 可 以 忽略 信号 ， 也 可 以 执行 独自 定义 的 信号 处 理 函 数 。 
。 如 果 收 到 多 个 信号 ， 旧 的 信号 将 被 覆盖 (SIGKIL 除外 ) 。 


。 由 执行 进程 检查 自己 是 否 收 到 了 信号。 因此 ， 癌 进程 发 送 的 信和 号 
未 必 会 立即 得 到 处 理 。 


。 跟踪 征 父 进程 介入 子 进程 处 理 的 机 制 ， 主 要 供 调试 硕 等 使 用 。 


第 IV 部 分 块 VO 系统 


块 设备 指 的 是 磁盘 等 可 以 处 理 大 量 数据 的 设备 。 包 丘 程序 在 内 的 数据 
被 保 他 在 块 设备 中 ,并 于 执行 时 读 取 至 内 存 。 第 IV 部 分 主要 介绍 以 下 内 


。 内 核 如 何 提高 对 块 设备 的 访问 性 能 
。 块 设备 驱动 如 何 操 作 块 设备 


通过 阅读 本 部 分 的 内 容 ,可 以 对 如 何 访问 保存 于 外 部 设备 中 的 数据 有 比 
较 清 晰 的 理解 。 


第 7 章 块 设备 子 系统 


7.1 设备 的 基础 
设备 的 种 类 
or. V6 使 用 的 周边 设备 可 以 分 为 块 设备 和 字符 设备 两 类 ( 表 7-1 


表 7-1 块 设备 和 字符 设备 的 比较 


: | 


moa a 从 起 始 块 开始 依次 分 配 0、1、2 等 地 址 不 ewe ts Eg 数据 
址 过 后 即 丢 


只 能 从 队列 的 起 始 
立 置 开始 访问 数据 
顺序 访问 ) 


(一 般 而 言 ) 低速 


适用 于 传输 大 量 数 据 5 内 核 通 过 使 组 1 |X. (buffer) 可 、 工 专 输 少量 数 
江 | 以 实现 缓存 (cache) 、 异 步 处 理 、 延 迟 写 入 等 功能 。 文 
“| 件 系统 也 是 构筑 在 块 设备 之 上 的 


磁盘 设备 、 磁 带 设 备 行 打印 机 、 欣 制 终 


端 


设备 驱动 


设备 驱动 是 操作 设备 的 程序 。 对 1 个 设备 或 相同 种 类 的 设备 ， 通 常 存 
在 与 其 对 应 的 1 个 设备 驱动 。 设 备 驱 动 由 设备 驱动 表 管理 ， 需 要 操作 
某 设 备 时 ， 设 备 驱 动 表 中 相应 的 驱动 将 被 调用 。 管 理 块 设备 驱动 的 设 
备 驱 动 表 为 bdevsw[] ， 而 管理 字符 设备 驱动 的 设备 驱动 表 为 
cdevsw[] (图 7-1) 。 


关于 块 设备 驱动 和 块 设备 驱动 表 的 详细 内 容 将 在 第 8 章 中 说 明 。 


设备 驱动 的 cdevsw[] 


内 核 ”; ”周边 设备 
存在 管理 块 设备 驱动 的 ' 
bdevswl] 和 管理 字符 设备 驱动 大 编号 2 


图 7-1 设备 驱动 表 


类 别 和 设备 编号 


设备 通过 类 别 (class) 和 长 度 为 16 比特 的 设备 编号 管理 。 类 别 用 来 
区 分 块 设备 和 字符 设备 。 设 备 编号 的 高 位 8 比特 为 大 (major) 编号 ， 
， 8 (minor) 编号 。 大 编号 表示 设备 种 类 ， 小 编号 则 分 配 
绍 [Ll 0 


类 别 决定 使 用 的 设 别 驱动 表 ， 大 编号 决定 设备 驱动 表 中 应 使 用 的 设备 
驱动 ， 小 编号 的 用 途 依 设备 而 异 。 


特殊 文件 


为 了 使 用 某 个 设备 ， 必 须 生 成 对 应 的 特殊 文件 。 系 统管 理 者 通过 执行 
， 后 /etc/mknod 生成 特殊 文件 。 特 殊 文 件 包括 设备 类 别 和 设备 
编号 等 内 容 。 


特殊 文件 在 /dev 下 和 生成， 文件 名 为 代表 该 设备 的 字符 串 和 小 编号 的 
组 合 。 例 如 /dev/rk0 。 


/etc/mknod 执行 成 功 后 ， 特 殊 文 件 被 添加 至 指定 目录 ， 也 将 自动 生 
成 对 应 的 inode (参见 第 9 章 ) 。 在 该 inode 内 会 设置 表示 设备 类 

I 同时 也 会 设置 inode .i_addr[0] 为 设备 编号 (图 7- 
2 O 


Laddr[0]， 大 编号 、 小 编号 
i_flag: 类 别 ( IFBLK 或 IFCHR ) 


图 7-2 特殊 文件 


如 果 对 此 特殊 文件 执行 open 、read、write 、close 系统 调用 ， 
1 的 处 理 钞 数 内 部 将 调用 与 大 编号 对 应 的 设备 驱动 ， 来 操 
’ O 


从 用 户 的 角度 来 看 ， 操 作 一 般 文件 与 操作 设备 具有 相同 的 处 理 界面 ， 

因此 在 进行 将 用 户 程序 的 输出 对 象 从 文件 变 为 行 打印 机 等 操作 时 ， 只 
需 切 换 open 处 理 的 对 象 即 可 (代码 清单 7-1 ) 。 这 可 以 视 为 UNIX 

V6 的 特征 之 一 。 


代码 清单 7-1 将 输出 对 象 从 文件 变更 为 设备 


fp = open( "/work/file" ); 
! 
fp = open( "/dev/xxx" ) ，; 


7.2 ” 块 设 备 子 系统 


访问 块 设备 的 处 理由 块 设 备 子 系统 统一 进行 。 块 设备 子 系统 由 知 干 男 
数 构成 此外， 对 块 设 备 进行 数据 读 写 时 使 用 的 缓冲 区 也 由 块 设备 子 
系统 进行 管理 (图 7-3 ) 


> 1 ~、, N 
内 核 ”! 周边 设备 


! 处 理 结束 
SR | 作 的 中 时 


NE 


图 7-3 块 设备 子 系统 


缓冲 区 


块 设备 子 系统 通过 缓冲 区 与 块 设备 进行 数据 交换 。 缓 冲 区 由 设备 编号 
和 块 编 号 命名 。 对 某 个 块 进行 处 理 时 ， 首 先 检 查 是 否 存在 所 需 的 缓冲 
区 ， 如 采 已 经 存在 则 使 用 该 缓冲 区 ， 如 有 果 疝 未 存在 则 从 未 分 配 的 缓冲 
区 中 获取 新 的 缓冲 区 ， 对 其 命名 后 使 用 (图 7-4) 。 


区 
| 噶 


请 求 
一 -一 


块 设备 人 
( 设备 编号 = devA ) 


缓冲 区 


块 设 备 B 
( 设备 编号 = devB ) 


图 7-4 块 设备 缓冲 区 


使 用 缓冲 区 的 目的 主要 有 两 个 。 首 先是 为 了 在 多 个 进程 同时 访问 同一 
个 块 时 保持 数据 的 一 臻 性。 通过 使 用 缓冲 区 和 排他 处 理 可 以 实现 这 一 
要 求 。 其 次 ， 将 需要 经 常 进行 读 写 操作 的 块 的 拷贝 (缓存) 保存 在 内 
存 中 以 改善 性 能 。 绥 存 能 够 减少 对 块 设备 的 访问 次 数 ， 由 于 块 设备 的 
访问 速度 与 CPU 的 执行 速度 相 比 十 分 缓慢 ， 因 此 减少 访问 次 数 将 使 系 
统 性 能 得 到 相应 提升 。 此 外 ， 还 采取 了 通过 将 需要 访问 的 数据 预先 读 
取 至 缓冲 区 ， 或 是 在 写 满 缓冲 区 后 再 向 块 设备 写 出 数据 等 方法 ， 提 高 
系统 的 性 能 。 

缓冲 区 由 buf 结构 体 的 数组 buf[] 管理 (代码 清单 7-2， 代 码 清单 7- 
3， 表 7-2 ) 。 通 过 将 b_dev 设 定 为 设备 编号 、b_blkno 设 定 为 块 编 
号 为 缓冲 区 命名 。 

代码 清单 7-2 buf[] (buf.h) 


Struct buf 

{ 
int b_flags; 
struct buf *b_forw; 
struct buf *b_back; 
struct buf *av_forw; 
struct buf *av_back; 
int b_dev; 
int b_wcount; 
char *b_addr; 
char *b_xmem; 
char *b_blkno; 
char b_error; 
char *b_resid; 

} buf [NBUF]; 


‘OOOOORODP 


#define B_WRITE 0 
#define B_READ 01 
#define B_DONE 02 
#define B_ERROR 04 
#define B_BUSY 010 
#define B_PHYS 020 
#define B_MAP 040 
#define B WANTED ©0100 
#define B_RELOC 0200 
#define B_ASYNC 0400 
#define B_DELWRI 01000 


代码 清单 7-3 NBUF (param.h) 


1 #define 


表 7-2 buf 结构 体 


十 有 
标志 变量 ) 


[CE 


读 写 长 度 。 在 访问 设备 时 以 2 的 补 数 形式 指定 
于 放置 设备 数据 
地 址 的 扩张 比特 。 用 于 保存 位 于 物理 地 址 第 16 比 特 之 后 的 数 
示 在 访问 设备 时 发 生 错 误 


于 RAW 输入 输出 。 保 存 因 错 误 而 无 法 传送 的 数据 的 长 度 (以 字 市 为 单 
本 7) 


表 7-3 缓冲 区 的 标志 


, 


标志 


进行 写 入 处 理 。 与 未 设置 B_READ 时 的 含义 相同 
浊 生 小 处理。 未 被 没 轩 时 表示 交行 写 入 外 到 


此 缓冲 区 拥有 最 新 的 数据 。 表 示 已 完成 与 设备 的 同步 ( 读 取 或 写 
B_DONE 入 ) ， 或 者 拥有 比 设备 更 新 的 数据 〈 写 入 ) 。 设 置 此 标志 时 ， 不 会 对 
设备 进行 读 取 数 据 的 处 理 
ee 妥 久 区 站 于 使 用 中 鸭 羽 起 .在 ar 


示 处 于 RAW 输入 输出 的 状态 
二 区 处 于 使 用 中 的 状态 。 第 三 者 缓冲 区 被 释放 


B ASYNC 进行 预先 读 取 ， 异 步 写 入 。 不 等 待 设备 处 理 结束 。 处 理 结束 后 ， 在 被 
调用 的 iodone0 中 对 B_BUSY 进 行 重 置 


B DELWRI 进行 延迟 写 入 。 并 非 立 刻 将 数据 写 入 设备 ， 而 是 在 通过 getblk() 对 绥 ? 
区 进行 再 分 配 时 ， 或 是 在 bflush0 被 调用 时 将 数据 写 入 设备 


buf 结构 体 用 于 保存 缓冲 区 的 状态 等 管理 数据 。 块 设备 中 数据 的 拷贝 
保存 在 buffers[] 的 数组 元 素 中 ，buf.b_addr 则 指向 该 元 素 ( 代 
码 清单 7-4 ) 。buf,b_addr 和 buffers[] 的 关联 通过 binit() 设 
定 (图 7-5) 。 


缓冲 区 的 
管理 信息 


图 7-5 buf 和 buffers 


代码 清单 7-4 _ buffers[] (dmzxr/bio.h) 


1 char buffers[NBUF][514] ， 


b-list 和 av-list 
buf[] 通过 b-list 和 av-list 的 双重 环形 队列 管理 (图 7-6) 。 


ee 
ee _tab 
ee EN 人 
并 一， Sd 
Es ee bs EG 2 


bfreelist 
一 一 一 


— b> b-list 
------ > av-list 


图 7-6 b-list 和 av-list 


b-list 用 来 管理 已 分 配给 各 块 设备 的 缓冲 区 ， 通 过 buf.,b_forw 和 
buf.b_back 构成 环形 队列 。 位 于 各 b-list 头 部 的 元 素 为 devtab 结 
构 体 ， 由 块 设备 驱动 表 bdevsw[] 的 d_tab 指定 (代码 清单 7-5， 表 
7-4 ) 。devtab 结构 体 也 用 于 设备 处 理 队 列 ， 详 细 请 参照 第 8 章 。 


但 是 ， 对 尚未 分 配给 设备 (NODEV ) 的 缓冲 区 而 言 ， 位 于 b-list 头 部 的 
元 素 为 bfreelist (代码 清单 7-6) 。 


av-list 用 来 管理 处 于 非 使 用 状态 (B_BUSY 以 外 ) 的 缓冲 区 ， 通 过 
buf.av_forw 和 buf,av_back 构成 环形 队列 。 由 av-list 管理 的 组 
冲 区 将 被 重新 分 配 (给 其 他 设备 ) 。 与 尚未 分 配给 设备 的 b-list 相同 ， 
位 于 av-list 头 部 的 元 素 为 bfree1List 。 无 论 是 b-list 还 是 av-list， 当 
队列 为 空 时 ， 队 列 头 部 的 元 素 指 向 自身 。 


代码 清单 7-5 ”devtab 结构 体 (buf.h) 


struct devtab 
{ 


1 

2 

3 char d_active; 

4 char d_errcnt; 

5 struct buf *b_forw; 
6 

7 

8 

9 


struct buf *b_back; 
struct buf *d_actf; 
struct buf *d_actl; 


}; 


表 7-4 devtab 结 校 


构 体 


bd 


指向 b-list 的 末尾 
人 
指向 设备 处 理 队列 的 末尾 


代码 清单 7-6 ”bfreelist (buf.h) 


1 Struct buf bfreelist; 


RAW 输入 输出 


向 块 设备 传送 数据 时 可 以 不 通过 缓冲 区 ， 并 且 不 受 块 长 度 (512 字 市 ) 
的 限制 ， 这 称 为 RAW (无 处 理 ) 输入 输出 ， 用 于 对 块 设备 的 数据 进行 
整体 备份 等 处 理 (图 7-7) 。 


一 般 情 况 下 ， 输 入 输出 功能 需要 通过 缓冲 区 与 虚拟 地 址 空间 交换 数 
据 。 但 是 RAW 输入 输出 可 以 直接 传送 数据 ， 无 需 通过 缓冲 区 。 


为 了 使 用 RAW 输入 输出 功能 ， 系 统管 理 者 需要 生成 专用 的 特殊 文件 。 
En 


虚拟 地 址 空间 缓冲 区 块 设备 


buffers[] 
一 般 输 入 输出 以 块 ( 512 字 节 ) 为 单位 ， 通 过 缓冲 区 与 
进程 的 内 存 空间 交换 数据 
虚拟 地 址 空间 块 设备 
RAW 输入 输出 交换 数据 时 无 需 通过 缓冲 区 ， 且 不 受 块 长 


度 ( 512 字 节 ) 的 限制 


图 7-7 ”一般 输 入 输出 和 RAW 输入 输出 
7.3 ”缓冲 区 的 初始 化 


binit() 


binit() 是 对 缓冲 区 进行 初始 化 的 函数 (代码 清单 7-7 ) 。 在 系统 启 
动 时 由 main( ) 调用 ， 且 仅 调 用 一 次 。 


代码 清单 7-7 binit0 (dmrbio.O 


1 binit() 


2 

3 register Struct buf *bp; 

4 register struct devtab *dp; 
5 register int i; 

6 struct bdevsw *bdp; 

7 

8 

9 


bfreelist.b_forw = bfreelist.b back = 
bfreelist.av_forw = bfreelist.av_back = &bfreelist 


10 for (i=0; i<NBUF; i++) { 

11 bp = &buf[i]; 

12 bp->b_dev = -1; 

13 bp->b_addr = buffers[i]; 

14 bp->b_back = &bfreelist,; 

15 bp->b_forw = bfreelist.b_forw; 
16 bfreelist.b_forw->b_back = bp; 
17 bfreelist.b_forw = bp; 

18 bp->b_flags = B_BUSY; 

19 brelse(bp); 

20 } 

21 i= 0; 

22 for (bdp = bdevsw; bdp->d_open; bdp++) { 
23 dp = bdp->d_tab; 

24 if(dp) { 

25 dp->b_forw = dp; 

26 dp->b_back = dp; 

27 } 

28 i++， 

29 } 

30 nblkdev = i; 

31 } 


12 b_dev = -1 表示 此 缓冲 区 处 于 NODEV 状态 。 


21~29 “对 赋予 bdevsw[] 的 devtab.d_tab 进行 初始 化 处 理 。 
将 位 于 各 设备 b-list 头 部 的 devtab 结构 体 的 成 员 变量 b_forw 和 
b_back 指 回 目 身 。 


30 ”将 nblkdev 设置 为 块 设备 (驱动 ， 的 数量 。 
binit() 对 buf[] 和 buffers[] 进行 关联 ， 将 所 有 的 缓冲 区 追加 至 


av-list 和 处 于 NODEV 状态 的 b-list。 此 外 ， 统 计 位 于 bdevswf[ ] 中 的 设 
备 驱 动 的 数量 ， 将 其 设置 到 nblkdev 中 (代码 清单 7-8) 。 


代码 清单 7-8 nblkdev (conf.h) 


1 nt nblkdev; 


clrbuf() 
clrbuf( ) 将 缓冲 区 的 数据 清 0 ( 表 7-5， 代 码 清单 7-9 ) 。 
表 7-5 drbuf0 的 参数 


1 clrbuf(bp) 
int *bp; 


{ 


register *p; 
register c; 


p bp->b_addr; 
c = 256; 
do 

*p++ = 0; 
while (--c); 


7.4 ”缓冲 区 的 获取 和 释放 


getblk() 


getblk() 是 取得 根据 设备 编号 和 块 编号 命名 的 缓冲 区 的 函数 ( 表 7- 
6， 代 码 清 单 7-10 ) 。 按 顺序 遍历 相应 设备 的 b-list， 寻 找 是 否 存在 所 
需 的 缓冲 区 。 找 到 后 将 其 从 av-list 中 删除 (设置 标志 位 B_ BUSY ) ， 
并 返回 该 缓冲 区 。 如 果 已 设置 了 该 绥 冲 区 的 标志 位 B_BUSY ， 则 设置 
标志 位 B_WANTED 并 进入 睡眠 状态 。 当 正在 使 用 该 缓冲 区 的 其 他 进程 
将 其 释放 后 ， 进 程 将 被 唤醒 。 


如 果 b-list 中 不 存在 所 需 的 缓冲 区 ， 则 取得 位 于 av-list 头 部 的 缓冲 区 
(设置 其 标志 位 为 B_BUSY ) ， 对 其 重新 命名 ， 并 追加 到 b-list 的 头 
部 ， 然 后 返回 该 缓冲 区 。 设 置 标志 位 B_BUSY 意 在 表示 该 缓冲 区 正 处 
于 使 用 中 的 状态 (图 7-8) 。 


\ 7 
devA 的 | devtab Hdev 
b-list \ / 
， 、 ee 
av-list | bfreelist ! 
\1 17 
Me 一 一 一 


如 果 不 存在 对 象 缓冲 区 ， 则 从 av-list 头 部 
取得 缓冲 区 并 将 其 插入 到 b-list 的 头 部 


图 7-8 getblk0) 


在 尝试 从 av-list 取得 缓冲 区 时 ， 如 果 该 缓冲 区 的 类 型 为 B_DELWRI 
(延迟 写 入 ) ， 则 需要 对 设备 进行 异步 读 写 。 


表 7-6 ”getblk0 的 参数 


1 getblk(dev, blkno) 

2 人 

3 register struct buf *bp; 

4 register struct devtab *dp; 

5 extern lbolt; 

6 

7 if(dev.d major >= nblkdev) 

8 panic("blkdev"); 

9 
10 loop: 
11 if (dev < 0) 
12 dp = &bfreelist; 
13 else { 
14 dp = bdevsw[dev.d_major].d_tab; 
15 if(dp == NULL) 
16 panic("devtab"); 
17 for (bp=dp->b_forw; bp != dp; bp = bp->b_forw) { 
18 if (bp->b_blkno!=blkno || bp->b_dev!=dev) 
19 continue; 

20 sp16(); 

21 if (bp->b_flags&B BUSY) { 
22 bp->b_flags =| B_WANTED; 
23 sleep(bp, PRIBIO); 

24 Sp10() ; 

25 goto 1oop 

26 } 

27 sp10(); 

28 notavail(bp); 

29 return(bp); 

30 } 

31 } 

32 spl16(); 

33 if (bfreelist.av_forw == &bfreelist) { 
34 bfreelist.b_flags =| B_WANTED; 


35 sleep(&bfreelist, PRIBIO); 


36 sp10(); 


37 goto loop; 

38 } 

39 spl0(); 

40 notavail(bp = bfreelist.av_forw); 
41 if (bp->b_flags & B DELWRI) { 
42 bp->b_flags =| B_ASYNC; 

43 bwrite(bp); 

44 goto loop; 

45 } 

46 bp->b flags = B_BUSY | B_RELOC; 
47 bp->b_back->b_forw = bp->b_forw; 
48 bp->b_forw->b_back = bp->b_back; 
49 bp->b_forw = dp->b_forw; 

50 bp->b_back = dp; 

51 dp->b_forw->b_back = bp; 

52 dp->b_forw = bp; 

53 bp->b_dev = dev; 

54 bp->b_blkno = blkno; 

55 return(bp); 

56 } 


7~8 ”如 果 大 编号 的 值 过 大 则 调用 panic()。 


11~12 ”NODEV (-1) 时 的 处 理 。 将 dp 设置 为 NODEV 的 b-list 
的 起 始 元 系 。 


13 ” 非 NODEV 时 的 处 理 。 


14~16 ”从 bdevsw[] 中 取得 相应 设备 的 devtab 结构 体 (b-list 
的 起 始 元 素 ) 。 


17~19 ”遍历 b-list， 检 查 是 否 存 在 所 需 的 缓冲 区 。 

20 ”如 有 果 成 功 找到 ， 则 将 处 理 器 优先 级 提升 为 6， 防 止 发 生 中 
断 。 由 于 块 设备 处 理 结束 时 3 引发 的 中 断 处 理 等 会 操作 缓冲 区 ， 因 
此 抑制 中 断 可 以 避免 在 操作 缓冲 区 时 发 生 冲 突 。 


21~26 ”如果 此 缓冲 区 正在 使 用 ， 则 设置 B_WANTED 标志 位 并 进 
入 睡 眼 状态。 


27~29 ”将 处 理 器 优先 级 重 置 为 0， 设 置 处 于 使 用 中 的 标志 位 ， 然 
后 将 缓冲 区 从 av-list 中 删除 ， 返 回 该 缓冲 区 。 


32 ”如果 在 b-list 中 没有 找到 所 需 的 缓冲 区 ， 或 是 和 希望 取得 
NODEYV 的 缓冲 区 时 ， 从 av-list 中 取得 缓冲 区 ， 并 将 处 理 器 优先 级 
提升 至 6 防止 发 生 中 断 。 


33~38 ”av-list 为 空 时 的 处 理 。 设 置 av-list 的 起 始 元 素 
bfreelist 的 B_WANTED 标志 位 并 进入 睡眠 状态 。 


39 “将 处 理 夯 优 和 级 重 置 为 0。 


40 ”取得 av-list 的 起 始 元 素 的 绥 冲 区 ， 将 其 从 av-list 中 删除 ， 并 
对 其 设置 B_BUSY 标志 位 。 


41~45 ”如 果 取 得 的 缓冲 区 设置 了 B_DELWRI (延迟 写 入 ) 标志 
位 ， 则 立刻 对 设备 进行 异步 写 入 ， 且 无 需 等 待 设备 的 处 理 结束 。 


46 ”B_RELOC 标志 位 在 UNIX V6 中 未 被 使 用 。 此 时 只 设置 了 
B_BUSY (和 B_RELOC ) 标志 位 。 请 注意 ,不 是 bp->b_flags 
=| 而 是 bp->b_flags =。 

47~48 ”将 缓冲 区 从 当前 分 配 的 b-list 中 删除 。 

49~52 ”将 缓冲 区 追加 至 新 的 b-list 的 起 始 位 置 。 

53~54 ”为 缓冲 区 命名 。 

55 ”返回 缓冲 区 。 


notavail() 


notavail( ) 是 将 缓冲 区 从 av-list 中 删除 ， 同 时 设置 B_BUSY (使 用 
中 ) 标志 位 的 函数 ( 表 7-7， 代 码 清单 7-11 ) 


表 7-7 notavail( 的 参数 


notavail(bp) 

struct buf *bp; 

{ 
register struct buf *rbp; 
register int sps; 


bp; 
= PS->integ; 


rbp->av_back->av_forw = rbp->av_forw; 
rbp->av_forw->av_back = rbp->av_back; 
rbp->b_flags =| B_BUSY; 

PS->integ = sps; 


9 ”将 处 理 器 优先 级 提升 至 6， 防止 发 生 中 断 。 由 于 块 设备 引发 的 
中 断 处 理 等 会 操作 缓冲 区 ， 因 此 抑制 中 断 可 以 避免 在 操作 缓冲 区 
时 发 生 冲 突 。 
10~11 ”从 av-list 中 删除 对 象 缓冲 区 。 
12 ”设置 B_BUSY 标志 位 ， 表 明 此 缓冲 区 正在 使 用 。 
13 ”将 处 理 姨 优先 级 恢复 原 值 。 

brelse() 

brelse( ) 用 来 释放 缓冲 区 (清除 B_BUSY 标志 位 ) ， 并 将 被 释放 的 


缓冲 区 追加 至 av-list ( 表 7-8， 代 码 清单 7-12 ) 。 已 分 配给 b-list 的 组 
冲 区 不 会 从 b-list 中 删除 。 


表 7-8 ”brelse() 的 参数 


1 brelse(bp) 
2 struct buf *bp; 


register Struct buf *rbp, **backp; 
register int sps; 


rbp = bp; 

If (rbp->b_flags&B_ WANTED) 
wakeup(rbp); 

If (bfreelist.b flags&B WANTED) { 
bfreelist.b_flags =& ~B_WANTED; 
wakeup(&bfreelist ) ， 


} 

If (rbp->b_flags&B_ERROR) 
rbp->b_dev.d_minor = -1; 

backp = &bfreelist.av_back; 

sps = PS->integ; 

sp16(); 

rbp->b_flags =& ~(B_WANTED|B_BUSY|B_ASYNC); 

(*backp)->av_forw = rbp; 

rbp->av_back = *backp; 

*backp = rbp; 

rbp->av_forw = &bfreelist; 

PS->integ = sps; 


8~9 ”唤醒 正 在 等 每 当前 缓 促 区 的 进程 。 


10~13 ”唤醒 正在 等 待 缓冲 区 要 补充 到 av-list 的 进程 。 清 除 
bfreelist 的 B_WANTED 标志 位 。 


14~15 ”如 采 由 于 设备 操作 错误 导致 设置 了 缓冲 区 的 错误 标志 ， 则 
将 小 编号 设置 为 -1° 缓冲 区 的 设备 编号 发 生 了 变化 ， 如 果 不 通过 
av-list 重新 分 配 ， 此 缓冲 区 将 无 法 再 次 取得 ， 因 为 其 中 容纳 的 数据 
有 可 能 是 错误 的 ， 需 要 防止 错误 数据 被 使 用 。 

17~18 ”保存 PSBW， 将 处 理 器 优先 级 提升 至 6 防止 发 生 中 断 。 

19 ”清除 B_WANTED 、B_BUSY 和 B_ASYNC 标志 位 。 

20~23 ”将 缓冲 区 返回 至 av-list 的 末尾 。 


24 ”将 处 理 絮 优先 级 返回 原 值 。 


7.5” 读 取 
读 取 的 种 类 


读 取 分 为 同步 读 取 和 异步 读 取 两 种 类 型 。 


同步 读 取 时 ， 进 程 首先 使 用 getblk( ) 取得 缓冲 区 ， 然 后 对 块 设备 提 
出 读 取 请 求 ， 并 执行 jowait( ) 进入 睡眠 状态 。 当 块 设 备 的 处 理 完 成 
后 ， 由 中 断 处 理 函 数 执行 的 iodone( ) 唤醒 入 睡 的 进程 。 随 后 ， 该 进 
程 执行 brelse( ) ， 释 放 获 取 的 缓冲 区 (图 7-9) 。 


异步 读 取 时 ， 进 程 继 续 原 有 处 理 ， 无 需 等 待 块 设备 的 读 取 处 理 结束 。 
缓冲 区 由 中 断 处 理 函 数 执行 的 iodone( ) 自动 释放 。 当 已 设置 了 缓冲 
区 的 B_ASYNC 标志 位 时 ， 表 示 当 前 读 取 为 异步 读 取 (图 7-10) 。 


异步 读 取 采用 预 读 取 的 方式 。 该 方式 指 按 顺序 读 取 属于 某 个 文件 的 块 
时 ， 预 完 将 下 一 个 块 的 数据 读 取 至 缓冲 区 。 


进程 1 进程 2 


块 设备 


getblk() 
+B_BUSY 


IOWalit() 


读 出 数据 


| 人 
中 断 处 理 


函数 
iodone!() 
brelse() 
一 B_BUSY 


图 7-9 同步 读 取 


getblk() 
+ B_BUSY 


+B_ASYNC 
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“让 断 处 理 中 断 
范 数 
+B_DONE ndonelt 
brelse() 
—- B_BUSY 
图 7-10 异步 读 取 


bread() 


bread( ) 是 进行 同步 读 取 的 函数 ( 表 7-9， 代 码 清 单 7-13) 。 它 通过 
检查 由 getblk( ) 获取 的 缓冲 区 的 B_DONE 标志 位 来 判断 缓冲 区 内 的 
I 否 为 最 新 。 如 果 为 最 新 则 不 会 访问 设备 ， 否 则 会 对 设备 进行 访 


表 7-9 ”bread0 的 参数 


代码 清单 7-13 bread() (dmr/bio.c) 


bread(dev, blkno) 
{ 
register struct buf *rbp; 
rbp = getblk(dev, blkno); 
if (rbp->b_flags&B_DONE) 
return(rbp); 
rbp->b_flags =| B_READ; 


OOOOORRODP 


rbp->b_wcount = -256; 

(*bdevsw[dev.d_ major].d_strategy)(rbp); 
iowait(rbp); 

return(rbp); 


8~10 ”设置 B_READ 标志 位 ， 将 读 取 长 度 设 定 为 -256 (表示 512 
字 节 ) ， 然 后 执行 设 定 于 bdevsw[] 中 的 设备 访问 函数 。 


11 执行 Towait( ) ， 进 入 等 待 状态 直到 设备 的 读 取 处 理 结束 。 
12 ”返回 缓冲 区 ， 该 缓冲 区 用 来 容纳 从 设备 读 取 的 数据 。 
iowait() 


iowait() 是 等 竺 设备 处 理 结束 的 函数 ( 表 7-10， 代 码 清单 7-14 ) 。 
它 使 进程 进入 睡眠 状态 直至 设置 缓冲 区 的 B_DONE 标志 位 。 


表 7-10 ”iowait0 的 参数 


iowait(bp) 
struct buf *bp; 


{ 


register Struct buf *rbp 


rbp = bp; 

sp16( ); 

while ((rbp->b_flags&B_DONE )==0) 
sleep(rbp, PRIBIO); 

sp10(); 

geterror(rbp); 


iodone() 


iodone( ) 是 在 块 设备 的 处 理 结束 后 被 调用 的 函数 ， 用 来 设置 缓冲 区 
的 B_DONE 标志 位 ( 表 7-11， 代 码 清单 7-15 ) 。 它 在 块 设备 处 理 结束 
时 执行 的 中 断 处 理 函 数 中 被 调用 。 


同步 读 写 时 ， 唤 醒 正在 等 待 缓冲 区 的 进程 。 异 步 读 写 时 执行 
brelse( ) 释放 缓冲 区 。 


表 7-11 iodone() 的 参数 


代码 清单 7-15 iodone() (dmr/bio.c) 


1 iodone(bp) 
2 struct buf *bp; 


register Struct buf *rbp; 


rbp = bp; 

if(rbp->b_flags&B_MAP) 
mapfree(rbp); 

rbp->b_flags =| B_DONE; 

If (rbp->b flags&B_ASYNC ) 
brelse(rbp); 

else { 
rbp->b_flags =& ~B_WANTED; 
wakeup(rbp); 


7~8 ”在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 


geterror() 


geterror() 是 处 理 错 误 的 函数 ( 表 7-12， 代 码 清单 7-16) 。 如 果 未 
设置 buf .b_flags 的 错误 标志 位 ， 则 不 做 任何 处 理 。 


表 7-12 geterror( 的 参数 


代码 清单 7-16 geterror() (dmr/bio.c) 


1 geterror(abp) 
2 struct buf *abp; 


3 1 

4 register struct buf *bp; 

5 

6 bp = abp; 

7 if (bp->b_flags&B_ERROR) 

8 If ((u.u_error = bp->b_error)==0) 
9 u.u_error = EIO; 
10 } 


breadal() 

breada( ) 是 从 块 设备 读 取 数 据 ， 同 时 也 负责 预 读 取 的 函数 ( 表 7- 
13， 代 码 清单 7-17 ) 。 预 读 取 是 异步 进行 的 ， 当 设备 的 读 取 处 理 结束 
上 时， 由 块 设备 驱动 执行 的 iodone( ) 释放 缓冲 区 。 


表 7-13 breada( 的 参数 


代码 清单 7-17 breada() (dmr/bio.c) 


reada(adev, blkno, rablkno) 


b 


register struct buf *rbp, *rabp; 
register int dev; 


dev = adev; 
rbp = 0; 
if (!incore(dev, blkno)) { 


1 
2 
3 
4 
5 
6 
7 
8 
9 rbp = getblk(dev, blkno); 


10 If ((rbp->b_flags&B_DONE) == 0) { 


11 rbp->b_flags =| B_READ; 

12 rbp->b_wcount = -256; 

13 (*bdevsw[adev.d_ major].d_strategy)(rbp); 
14 } 

15 } 

16 if (rablkno && !incore(dev, rablkno)) { 

17 rabp = getblk(dev, rablkno); 

18 if (rabp->b_flags & B_DONE) 

19 brelse(rabp); 

20 else { 

21 rabp->b_flags =| B_READ|B_ASYNC; 

22 rabp->b_wcount = -256; 

23 (*bdevsw[adev.d_ major].d_strategy)(rabp); 
24 } 

25 } 

26 if (rbp==0) 

27 return(bread(dev, blkno)); 

28 iowait(rbp); 

29 return(rbp); 

30 } 


和 执行 jncore( ) ， 检 查 准备 读 到 的 设备 的 块 的 缓冲 区 是 否 存 
和 外国 O 


9~14 ”如 果 绥 冲 区 不 存在 ， 则 执行 getblk( ) 获取 缓冲 区 。 如 果 
尚未 设置 获取 的 缓冲 区 的 B_DONE 标志 位 ， 则 启动 从 设备 读 取 数 
据 的 处 理 。 


16 ”准备 进行 预 处 理 ， 上 且 绥 冲 区 不 存在 时 的 处 理 。 
17~24 ”执行 getblk( ) 获取 缓冲 区 。 如 果 已 设置 了 获取 的 缓冲 
区 的 B_DONE 标志 位 ， 则 表示 已 有 数据 被 读 取 ， 因 此 要 执行 


brelse( ) 释放 缓冲 区 。 如 果 未 设置 B_DONE 标志 位 ， 则 开始 从 
“4 。 请 注意 ， 此 处 并 没有 等 竺 读 取 处 理 执行 结 


26~27 ”如 果 准 备 读 取 ( 非 预 读 取 ) 的 块 的 缓冲 区 已 经 存在 ， 则 执 
行 bread() 读 取 数据 ， 并 返回 该 缓冲 区 。 


28 ”执行 1owait( ) 等 待 设备 的 同步 读 取 处 理 结束 。 


29 ”返回 同步 读 取 的 缓冲 区 。 
incore() 


incore( ) 检查 分 配给 某 个 设备 的 某 个 块 的 缓冲 区 是 否 存在 ( 表 7- 
14， 代 码 清单 7-18 ) 。 如 果 存 在 则 返回 该 缓冲 区 ， 如 果 不 存在 则 返回 
0。incore( ) 遍历 该 设备 的 b-list， 对 buf 结构 体 的 b_blkno 和 
b_dev 分 别 进 行 检查 。 


表 7-14 incore() 的 参数 


ncore(adev, blkno) 


i 


register int dev; 
register struct buf *bp; 
register struct devtab *dp; 


dev = adev; 
dp = bdevsw[adev.d major].d_tab; 
for (bp=dp->b_forw; bp != dp; bp = bp->b_forw) 
if (bp->b_blkno==blkno && bp->b_dev==dev) 
return(bp); 
return(0); 


写 入 的 种 类 


写 入 可 以 分 为 同步 写 入 、 异 步 写 入 、 延 迟 写 入 3 种 类 型 。 同 步 写 入 和 
区 别 与 读 取 处 理 的 情况 相同 ， 前 者 等 待 设备 处 理 结束 ， 后 
` 等 繁 。 


延迟 写 入 时 ， 首 先 执 行 getblk( ) 取得 缓冲 区 ， 随 后 将 准备 写 入 设备 
的 数据 写 入 该 缓冲 区 。 但 是 此 时 并 不 对 设备 提出 写 入 请 求 ， 而 是 在 设 
置 缓冲 区 的 B_ASYNC 和 B_ DELWRI 标志 位 后 ， 执 行 brelse() 释 
放 缓 冲 区 。 


经 过 一 段 时 间 后 ， 当 再 次 执行 getb1Lk() (出 于 与 上 述 延 迟 写 入 不 同 
的 原因 ) ， 并 试图 再 次 分 配 已 设置 了 B_DELWRI 标志 位 的 缓冲 区 时 ， 
将 以 异步 执行 的 方式 对 设备 提出 写 入 数据 的 请 求 (图 7-11 ) 。 


此 外 ， 当 执行 刷新 缓冲 区 的 函数 bflush( ) 时 ， 也 会 使 用 已 设置 了 
B_DELWRI 标志 位 的 缓 神 区 ， 对 设备 进行 号 人 处 理 。 


进程 1 进程 2 块 设备 盏 


getb|k() 
一 B_BUSY 


+B_ASYNC 
+B_DELWRI 
brelsel() 


— B_BUSY 
getblk() 


如 果 设 置 了 
B_DELWRI 标 志 位 


+ B_DONE “让 断 处 理 
brelse!) 函数 
_B BUSY iodone!() 


图 7-11 延迟 写 入 
bwrite() 


bwrite( ) 将 缓冲 区 内 的 数据 写 入 设备 ( 表 7-15， 代 码 清 单 7-19) 。 
如 果 未 设置 B_ASYNC 标志 位 则 进行 同步 写 入 ， 和 否则 进行 异步 写 入 。 


表 7-15 “bwrite() 的 参数 


1 bwrite(bp) 

2 struct buf *bp; 

3 1 
register struct buf *rbp; 
register flag; 


rbp = bp; 
flag = rbp->b_flags,; 
rbp->b_flags =& ~(B_READ | B_DONE | B_ERROR | B_DELWRI); 
rbp->b_wcount = -256; 
(*bdevsw[rbp->b_dev.d_major].d_strategy)(rbp); 
if ((flag&B ASYNC) == 0) { 
iowait(rbp); 
brelse(rbp); 
} else if ((flag&B_ DELWRI )==0) 
geterror(rbp); 


9 ”清除 以 下 标志 位 : B_READ 、B_ DONE 、B_ERROR 、 
B_DELWRI 。 


11 ”执行 在 bdevsw[] 中 注册 的 设备 访问 画 数 。 
a 


12~14 ”如 果 未 设置 B_ASYNC 标志 位 ， 则 等 待 设备 处 理 结束 后 ， 
调用 brelse( ) 释放 缓冲 区 。 


15~16 ”如 果 已 设置 B_ASYNC 标志 位 ， 则 不 等 待 设备 处 理 结 
此 外 ， 如 果 未 设置 B_DELWRI 标志 位 ， 则 调用 geterror() 对 错 
误 进 行 检查 。 


bawrite() 


bawrite( ) 是 进行 异步 写 入 的 函数 〈 表 7-16， 代 码 清单 7-20 ) 。 该 
函数 首先 设置 B_ASYNC 标志 位 ， 然 后 调用 bwrite() 。 


表 7-16 bawrite() 的 参数 


bawrite(bp) 
struct buf *bp; 
{ 


register struct buf *rbp; 


rbp = bp; 
rbp->b_flags =| B_ASYNC; 
bwrite(rbp); 


bdwrite() 


bdwrite( ) 进行 延迟 写 入 ( 表 7-17， 代 码 清单 7-21 ) 。 该 函数 首先 
设置 表示 延迟 写 入 的 B_DELWRI 标志 位 ， 然 后 释放 缓冲 区 。 


表 7-17 bdwrite() 的 参数 


代码 清单 7-21 bdwrite0 (dmr/bio.c) 


bdwrite(bp) 

struct buf *bp; 

{ 
register struct buf *rbp; 
register struct devtab *dp; 


rbp = bp; 
dp = bdevsw[rbp->b_dev.d major].d_tab; 
if (dp == &tmtab || dp == &httab) 


bawrite(rbp); 
else { 
rbp->b_flags =| B_DELWRI | B_DONE; 
brelse(rbp); 
} 
} 


8~10 ”如 采写 入 的 对 象 为 磁带 设备 ， 则 调用 bawrite() 并 立刻 
进行 写 入 处 理 。 


bflush() 

bflush( ) 将 延迟 写 入 缓冲 区 内 的 数据 一 次 性 写 入 设备 ( 表 7-18， 代 
码 清 单 7-22 ) 。bflush() 被 update() 调用 ,而 update() 被 
panic()、sync()、sumount() 调 用。 


在 UNIX V6 的 环境 中 ， 守 护 程序 /etc/update 每 隔 30 秒 运 行 一 次 
sync 指令 


表 7-18 ”bflush() 的 参数 


处 理 对 象 的 设备 编号 。 值 为 -1 (NODEV) 时 刷新 所 有 设备 的 延迟 写 入 缓冲 区 


代码 清单 7-22 bflush() (dmr/bio.c) 


flush(dev) 


register struct buf *bp; 


bp->b_flags =| B_ASYNC; 


notavail(bp); 
bwrite(bp); 
goto loop; 


7.7 RAW 输入 输出 


physio() 


physio() 是 进行 RAW 输入 输出 的 函数 〈 表 7-20， 代 码 清单 7-23 

) 。 传 送 数据 的 地 址 、 长 度 以 及 在 块 设备 中 的 偏 移 量 ， 都 通过 user 
结构 体 指 定 ( 表 7-19 ) 

physio( ) 由 注册 于 字符 设备 驱动 表 中 用 于 RAW 输入 输出 的 设备 驱动 
调用 。 所 使 用 的 缓冲 区 不 是 buf[] ， 而 是 供 RAW 输入 输出 专用 的 组 
冲 区 (参见 第 8 章 ) 


处 理 的 流程 为 ， 读 入 用 户 APR 的 值 ， 根 据 庶 拟 地 址 直接 计算 出 物理 地 
址 ， 然 后 向 缓冲 区 传递 参数 ， 再 执行 访问 块 设备 的 画 数 。 


表 7-19 传递 给 physio0 的 user 结构 体 成 员 变量 


Ce oem 


表 7-20 physio(0) 的 参数 


指向 块 设备 访问 函数 的 指针 


和 证 是 让 还 是 和 


的 是 RAW 输入 输出 专用 


代码 清单 7-23 physio0 (dmr/bio.c) 


上 户 


1 physio(strat, abp, dev, rw) 
2 struct buf *abp; 
3 int (*strat)(); 


4 


5 
6 
7 
8 
9 
0 
工 


register Struct buf *bp; 
register char *base， 
register int nb 

Int ts; 


bp = abp， 
base = U.U_base 


12 if (base&o1 || u,u_count&o1 || base>=base+u.U_count ) 
13 goto bad ; 


14 ts = (u.u_tsize+127) & ~0177; 

15 If (u.u_sep 

16 ts = 0; 

17 nb = (base>>6) & 01777; 

18 if (nb < ts) 

19 goto bad; 

20 if ((((basetu.u_count)>>6)&01777) >= ts+tu.u_dsize 
21 && nb < 1024-u.U_ssize) 

22 goto bad ; 

23 sp16(); 

24 while (bp->b flags&B_BUSY) { 

25 bp->b_flags =| B_WANTED; 

26 sleep(bp, PRIBIO); 

27 } 

28 bp->b_flags = B_BUSY | B_PHYS | rw; 
29 bp->b_dev = dev; 

30 bp->b_addr = base&077; 

31 base = (u.u_sep? UDSA: UISA) ->r[nb>>7] + (nb&0177); 
32 bp->b_addr =+ base<<6; 

33 bp->b_xmem = (base>>10) & 077; 

34 bp->b_blkno = lshift(u.u_offset, -9); 
35 bp->b_wcount = -((u.u_count>>1) & 077777); 
36 bp->b_error = 0; 

37 u.u_procp->p_flag =| SLOCK; 

38 (*strat)(bp); 

39 spl6(); 

40 while ((bp->b_flags&B DONE) == 0) 

41 sleep(bp, PRIBIO); 

42 U.Uu_procp->p_flag =& ~SLOCK; 

43 if (bp->b_flags&B WANTED) 

44 wakeup (bp); 

45 Sp10() ; 

46 bp->b_flags =& ~(B_BUSY|B_WANTED); 
47 U.Uu_count = (-bp->b_resid)<<1; 

48 geterror(bp); 

49 return; 

50 bad: 

51 U.U_error = EFAULT,; 

52 } 


12~22 检查 作为 参数 传递 进来 的 user 结构 体 成 员 变 量 。 


。 传送 的 虚拟 地 址 为 偶数 


。 传送 的 数据 长 度 为 偶数 

。 虚拟 地 址 和 数据 长 度 之 和 是 否 洪 出 

。 是否 试图 传送 位 于 代码 段 领 域 的 数据 

。 传送 数据 是 否 位 于 数据 领域 (下限) 和 栈 领 域 (上 限 ) 之 间 
此 时 ts 的 值 为 代码 段 的 长 度 (以 64 字 市 为 单位 ， 并 以 128x64 字 
et ie ，nb 的 值 为 传送 数据 的 虚拟 地 址 (以 64 字 


24~27 ”如 果 供 RAW 输入 输出 使 用 的 缓冲 区 正在 使 用 ， 则 设置 
B_WANTED 标志 位 ， 然 后 进入 睡 眼 状态 直到 缓冲 区 被 释放 。 


28~37 ”将 作为 参数 的 user 结构 体 传递 给 缓冲 区 。 根 据 用 户 PAR 
的 值 从 虚拟 地 址 计算 得 到 物理 地 址 。 将 buf.b_xmem 设 定 为 物理 
内 存 第 16 位 之 后 的 部 分 。 从 u.u_offset 计算 出 块 编号 ， 同 时 
设 定 执行 进程 的 SLOCK 标志 位 ， 防 止 进程 被 换 出 至 交换 空间 。 

38 ”执行 设备 驱动 的 访问 函数 。 

40~41 ”进入 睡眠 状态 ， 等 待 块 设 备 处 理 结 

42 ”清除 SLOCK 标志 位 。 


43~44 如 采 有 进程 在 等 待 供 RAW 输入 输出 使 用 的 缓冲 区 ， 则 将 


其 唤醒 。 


47 buf.b_resid 中 保存 有 因 出 错 而 没 能 传送 的 数据 长 度 ， 将 
其 赋予 u.u_count 。 


swapQ) 


swap( ) 是 进行 交换 处 理 的 函数 ( 表 7-21， 代 码 清单 7-25 ) 。 该 函数 
使 用 buf 结构 体 类 型 的 变量 swbuf (代码 清单 7-24 ) 进行 RAW 输 
入 输出 实现 交换 处 理 (图 7-12 ) 。 因 为 swbuf 只 有 一 个 ， 无 法 同时 交 
换 两 个 以 上 的 进程 ， 所 以 需要 进行 排他 处 理 。 


swap( ) 为 swbuf 设 定 适 当 的 参数 ， 调 用 交换 磁盘 的 设备 张 动 读 写 数 
据 。 因 为 参数 的 长 度 以 64 字 万 为 单位 ， 所 以 需要 将 地 址 变 为 字 节 单 
位 ， 再 将 长 度 〈 字 长 ) 变 为 2 的 补 数 的 形式 。 这 些 值 最 后 都 会 赋予 交 
换 磁盘 的 寄存 器 。 请 参考 physio( ) 以 及 第 8 章 中 有 关 RK 的 寄存 器 
的 内 容 。 


代码 清单 7-24 swbuf (bio.0) 


1 struct buf Swbuf ， 


交换 处 理 专用 的 buf 结 构 体 。 因 为 使 Pr 
用 RAW 输 入 输出 ， 所 以 每 次 的 传送 文 凑 全 加 
量 都 不 受 块 长 度 ( 512 字 节 ) 的 限 
制 。 但 是 ， 并 不 具备 缓存 的 功能 


物理 内 存 


代码 段 及 数据 段 


图 7-12 swbuf 
表 7-21 swap0 的 参数 


交换 磁盘 中 的 块 编号 


交换 对 象 的 物理 内 存 地 址 (以 64 字 节 为 单位 ) 
交换 对 象 的 长 度 (以 64 字 节 为 单位 


四 全 换 出 。1: 换 入 


代码 清单 7-25 swap() (dmr/bio.c) 


swap(blkno, coreaddr, count, rdf]1g) 
{ 
register int *fp; 
fp = &swbuf.b_flags,; 
sp16(); 
while (*fp&B_ BUSY) { 
*fp =| B_WANTED; 
sleep(fp, PSWP); 


*fp = B_BUSY | B_PHYS | rdflg; 
swbuf.b_dev = swapdev; 
swbuf.b_wcount = - (count<<5); 
swbuf.b_blkno = blkno; 
swbuf.b_addr = coreaddr<<6; 
swbuf.b_xmem = (coreaddr>>10) & 077; 
(*bdevsw[ swapdev>>8].d_strategy)(&swbuf ) ; 
sp16(),; 
while( (*fp&B_DONE)==0) 

sleep(fp, PSWP); 
if (*fp&B_WANTED) 

wakeup (fp); 
sp10(); 
*fp =& ~(B_BUSY|B_WANTED); 
return(*fp&B_ERROR ) ， 


交换 和 磁盘 的 设备 编号 通过 swapdev 指定 (代码 清单 7-26 ) 。 系 统管 
理 者 可 以 根据 实际 环境 修改 这 个 值 ， 但 是 需要 对 内 核 进行 重新 构筑 。 

此 例 中 大 编号 和 小 编号 都 被 设 为 0， 第 8 章 的 bdevsw[] 的 例子 〈 代 
码 清单 8-1 ) 表示 的 是 RK 伺 盘 。 


代码 清单 7-26 swapdev (conf.c) 


1 int swapdev {(0<<8)|0}; 


7~10 ”如 果 有 其 他 进程 使 用 swbuf ， 则 设置 swbuf.b_flags 
的 B_WANTED 标志 位 ， 然 后 进入 睡眠 状态 。 


11 ”如 果 可 以 使 用 swbuf ， 则 设置 swbuf.b_flags 的 B_BUSY 
标志 位 (swbuf 使 用 中 ) 、B_PHYS 标志 位 (RAW 输入 输出 ) 和 
rdflg 标志 位 ( 读 取 或 写 入 ) 。 


12~16 ”设置 swbuf 的 参数 启动 交换 磁盘 的 输入 输出 。 将 通过 参 

数 设 定 的 以 64 字 节 为 单位 的 地 址 和 长 度 分 别 转换 为 字 节 单 位 和 2 

的 补 数 的 字 单 位 。 

17 ”调用 交换 磁盘 的 设备 驱动 。 

19~20 ”进入 睡眠 状态 等 得 交换 磁 强 的 处 理 结束 。 

21~22 ”交换 磁 强 的 处 理 结束 后 ， 唤 醒 正 在 等 待 swbuf 的 进程 。 

24 清除 swbuf 的 B_BUSY 标志 位 和 B_WANTED 标志 位 。 

25 ”返回 交换 处 理 成 功 与 否 的 标志 。 访 问 当 对 设备 失败 时 ， 设 备 

驱动 (rkstrategy() 等 ) 将 设 定 swbuf ,B_ERROR 标志 位 。 
7.8 小结 

。 设备 分 为 块 设备 和 字符 设备 两 种 。 

。 设备 驱动 群 由 设备 驱动 表 进 行 管理 。 

。 设备 由 类 别 和 设备 编号 进行 管理 。 

。 为 了 使 用 设备 ， 必 须 提前 生成 特殊 文件 。 

。 对 块 设备 的 处 理 集 中 在 块 设备 子 系统 


通过 块 设备 缓冲 区 访问 块 设备 。 缓 钟 区 你 证 了 数据 的 一 致 性 ， 同 
时 也 起 到 缓存 的 作用 。 


读 取 分 为 同步 读 取 和 异步 读 取 。 预 读 取 功能 采用 了 异步 读 取 。 

。 写 入 分 为 同步 写 入 和 异步 写 入 。 此 外 还 有 延迟 写 入 。 

通过 RAW 输入 输出 传输 数据 时 无 需 缓冲 区 ， 也 不 受 块 长 度 (512 
字 节 ) 的 限制 。 


第 8 章 块 设备 驱动 


8.1 什么 是 块 设备 驱动 


块 设备 驱动 为 操作 块 设备 的 程序 。 每 一 种 块 设备 都 具有 对 应 的 驱动 程 
序 。 驱 动 程序 集中 了 对 设备 的 各 种 操作 功能 ， 同 时 也 包含 了 设备 的 规 
格 参数 。 其 他 程序 通过 调用 与 设备 对 应 的 驱动 程序 ， 可 以 在 无 须 了 解 
设备 的 详情 下 进行 操作 。 

本 章 主 要 对 块 设 备 驱 动 进行 说 明 ， 字 符 设备 驱动 将 在 第 12 章 中 介绍 。 
块 设备 驱动 表 

块 设备 驱动 通过 块 设备 驱动 表 bdevsw[] 进行 管理 (代码 清单 8-1， 表 
8-1 ) 。bdevsw 结构 体 包 含 打开 、 关 闭 、 访 问 相 应 设备 的 函数 地 址 ， 


以 及 指向 位 于 b-list 起 始 位 置 的 devtab 结构 体 的 地 址 。 这 些 画 数 和 与 
设备 引发 的 中 断 相 对 应 的 处 理 函 数 ,构成 了 设备 驱动 的 实体 。 


代码 清单 8-1 bdevswf] (conf.h) 


truct bdevsw 


[tm 0) 


int (*d_open)(); 
int (*d_close)(); 
int (*d_strategy)(); 


ORODP 


6 int *d_tab; 
7 } bdevsw[]; 


表 8-1 bdevsw 结构 体 


含义 


指向 打开 设备 的 函数 的 指针 
指向 关闭 设备 的 函数 的 指针 


取 和 与 入 # </ 仆 


bdevsw[] 本 吴 定义 在 conf.c 中。 bdevsw[] 中 包含 了 与 系统 中 所 
有 块 设备 (的 种 类 ) 相对 应 的 设备 驱动 。 系 统管 理 者 要 根据 系统 构成 
编辑 bdevsw[] ， 并 对 内 核 进 行 重新 构筑 。 


代码 清单 8-2 bdevsw[] (conf.c) 


1 int (*bdevsw[])() 

2 

3 &nulldeyv, &nulldev, &rkstrategy, rktab, /* rk */ 
4 &nodev， &nodeyv, &nodev， 90， /* rp */ 
5 &nodev， &nodev， &nodev， ©, /* rf */ 
6 &nodev， &nodev， &nodev， ©, /* tm */ 
7 &nodev， &nodev， &nodev， ©, /* tc */ 
8 &nodev， &nodeyv, &nodev， ©, /* hs */ 
9 &nodev， &nodeyv, &nodev， ©, /* hp */ 
10 &nodev， &nodev， &nodev， ©, /* ht */ 
11 (©) 


| 


设备 的 大 编号 与 bdevsw[] 的 数组 下 标 相 对 应 。 在 代码 清单 8-2 的 示 
. 中 ， 大 编号 0 对 应 RK 侯 副 设备 ，1 对 应 RP 人 磁盘 设备 .……. 以 此 类 


设备 处 理 队 列 


设备 驱动 拥有 设备 处 理 队列 。 队 列 涉 部 的 元 素 与 b-list 相同 ， 为 
devtab 结构 体 (bdevsw[].d_tab ) 。 队 列 中 包含 缓冲 区 。 
devtab 结构 体 的 d_actf 和 d_actl 分 别 指向 位 于 头 部 和 末尾 的 组 
冲 区 ， 而 各 缓冲 区 的 buf.av_forw 指向 后 方 的 缓冲 区 。 末 尾 的 缓冲 
区 的 buf.av_forw 指 向 NULL (0) 。 


设备 驱动 使 用 的 缓冲 区 的 状态 为 处 理 中 (B_BUSY ) ， 并 从 av-list 中 清 
除 。 因 此 ， 即 使 直接 操作 buf .av_forw 的 值 ， 也 不 会 和 av-list 发 生 
伸 突 3 


i 设备 驱动 从 队列 的 头 部 开始 处 理 
8-1) 。 


d_act| 
d_actf av-_ 四 av_ av forw av_forw 
从 队列 的 头 部 开始 依次 处 理 缓冲 区 被 追加 到 末尾 
图 8-1 设备 处 理 队列 
处 理 流程 


块 设备 的 处 理 流程 如 下 所 示 (图 8-2 ) 。 请 注意 ， 具 体 细节 由 设备 驱动 
的 实现 方法 决定 ， 这 里 给 出 的 只 是 比较 典型 的 例子 。 


1. 内 核 (主要 是 块 设备 子 系统 ) 执行 访问 函数 
2. 将 传递 进来 的 缓冲 区 退 加 人 至 设备 处 理 队列 


3. 操作 设备 的 寄存 器 ， 并 开始 对 位 于 设备 处 理 队 列 头 部 的 缓冲 区 进行 
输入 输出 处 理 


4. 处 理 结束 后 设备 将 引发 中 断 。 如 条 设备 处 理 队列 中 还 留 有 缓冲 区 ， 
中 断 处 理 钞 数 将 继续 进行 输入 输出 处 理 


当 系 统 运行 时 ， 打 开设 备 的 函数 会 预先 对 设备 进行 初始 化 处 理 。 当 系 
统 运 行 结束 时 ， 关 闭 设 备 的 函数 将 终止 设备 的 运行 。 根 据 设备 的 种 
类 ， 这 些 处 理 也 不 总 是 必须 进行 的 。 


内 核 


设备 处 理 队 列 


回 缓冲 区 被 追加 到 
设备 处 理 队 列 
@) 从 设备 处 理 队列 的 

头 部 开始 进行 输入 

输出 处 理 


(中 执行 访问 函数 


中 断 处 理 函 数 


四 设备 处 理 结束 时 
引发 中 断 


图 8-2 块 设备 驱动 的 处 理 流程 
8.2”RK-11 爸 盘 驱动 


下 面 以 DEC 公司 开发 的 RK-11 磁盘 的 设备 驱动 为 例 介 绍 块 设备 驱动 。 
RK-11 磁盘 具有 多 个 型 号 ， 此 处 以 RK11-D 为 对 象 。 


RK11-D 


RK11-D 是 由 工 个 磁盘 控制 器 及 1 人 台 磁 盘 构 成 的 大 容量 块 设备 。 此 外 还 
可 以 追加 7 台 型 号 为 RK05 的 磁 副 ,使 RK11-D 具备 管理 8 全 磁盘 的 能 
力 。 人 磁盘 具有 各 目的 小 编号 (图 8-3 ) 。 表 8-2 为 磁 强 的 规格 。 


RK11-D RKO5 


- 、 / 、 
一 ™ / 、 
二 i i i 


控制 器 磁盘 磁盘 磁盘 磁盘 


拥有 控制 用 的 。 ”小 编号 0 小 编号 1 小 编号 2 小 编号 3 
寄存 器 


磁盘 磁盘 磁盘 磁盘 终结 器 


小 编号 4 小 编号 5 小 编号 6 小 编号 7 
Unibus 


最 多 可 设置 8 台 磁 盘 ， 各 磁盘 具有 属于 自己 的 小 编号 


图 8-3 RK11-D 


表 8-2 RK11-D 


200+3 (预备 ) 


1200K+18K (预备 ) 
特殊 文件 


系统 管理 者 在 目录 /dev 下 生成 名 为 rkn (n 为 小 编号 ) 的 特殊 文 
(2 


8 以 上 的 小 编号 具有 特殊 意义 。 数 据 分 散 保存 于 rk 0 至 rk (x-8)! 的 各 
个 磁 副 中 。 小 编号 为 d_(d 大 于 等 于 8 ) 的 设备 编号 为 b 的 块 ， 实 际 对 
应 小 编号 为 b%(d-7) 的 设备 b/(d-7) (小 数 后 的 部 分 向 下 取 整 ) 的 块 。 比 
如 说 小 编号 为 10 的 设备 编号 为 10 的 块 ， 实 际 对 应 小 编号 为 1 的 设备 
编号 为 3 的 块 ( 表 8-3 ) 。 如 果 小 编号 不 使 用 0~7， 只 使 用 8 以 上 的 某 
个 值 ， 可 以 将 所 有 位 僵 模 拟 为 一 台大 容量 的 磁盘 。 


1 此 处 的 x 表示 任意 大 于 等 于 8 的 小 编号 。 即 磁盘 rkx 的 数据 将 分 散 保存 于 rk0 至 水 (x-8) 的 
各 个 人 磁盘 中 。 参见 表 8-3。 =。 译 者 注 


表 8-3 小 编号 为 10 的 设备 编号 为 10 的 块 


作为 供 RAW 输入 输出 使 用 的 特殊 文件 ， 在 目录 /dev 下 同时 也 生成 名 
0 tn 为 小 编号 ) 的 特殊 文件 。 对 应 的 设备 种 类 被 设 定 为 字符 设 


设 定 bdevswf] 


以 下 的 说 明 是 假设 RK 位 盘 的 大 编号 为 0° 将 bdevsw[0] 设 定 为 RK 
的 磁盘 驱动 (代码 清单 8-3 ) 。RK 磁盘 因为 无 需 做 打开 和 关闭 处 理 ， 
所 以 相应 的 函数 也 会 被 设 为 nulldev( )。 访 问 函数 为 
rkstrategy()， 而 bdevsw.d_tab 被 设 定 为 rktab (代码 清单 8- 
4) 。 


代码 清单 8-3 bdevswf[] 中 的 相关 部 分 (conf.c) 


&nulldeyv, &nulldev, &rkstrategy, rktab, /* rk */ 


代码 清单 8-4 rktab (dmr/rk.c) 


1 struct devtab rktab; 


| 


中 断 处 理 函 数 


RK 磁盘 在 处 理 结束 后 ， 会 通过 中 断 优 先 级 5、 回 量 0220 引发 中 断 。 
将 执行 与 向 量 对 应 的 中 断 处 理 函 数 rkintr() ， 针 对 缓冲 区 进行 结束 
输入 输出 的 处 理 。 当 设备 发 生 错 误 时 将 重 试 10 次 ， 重 试 的 次 数 由 


devtab ,d_errcnt 管理 。 


RK11-D 的 寄存 器 

RK11-D 具有 7 个 控制 寄存 器 ( 表 8-4 ) 。RKCS 的 第 0 比特 位 为 1 
时 ，RKBA 和 RKCS 的 5~4 比特 表示 的 物理 内 存 地 址 和 RKDA 表示 的 
磁盘 地 址 之 间 ， 将 传输 RKWC 定义 的 长 度 的 数据 。 


表 8-4 RK11-D 的 寄存 器 


示人 磁盘 状态 。 只 有 在 表示 磁 副 驱动 中 发 生 错 误 时 才 
吏 用 。 参 见 表 8-5 


Brror 寄存 器 。 | 表示 错误 居 态 。 只 有 在 表示 厂 盘 驱动 中 发 生 错 误 时 才 


Control Status 寄存 FF 控制 磁盘 。 参 见 表 8-7 
器 Ea 


Current Bus 往 住 洋 关 所 所 a | 
Address 寄存 器 ! 待 传送 数据 的 地 址 。 参 见 表 8-9 


RKDB | Data Buffer 寄存 


表 8-5 RKDS 


器 在 控制 器 和 磁盘 间 传 输 数 # 
进行 操作 。 参 见 表 8-11 


断 的 磁盘 


被 选择 的 磁盘 是 否 处 于 Ready 状态 


! 待 传送 数据 的 地 址 。 参 见 表 8-10 


是 时 使 用 


° 设备 驱动 不 对 其 


表示 人 磁 姐 的 磁头 
求 的 状态 


于 未 动作 状态 ， 


被 选择 的 磁盘 是 否 


于 可 以 接受 下 


i 


表示 磁 强 的 磁头 是 否 已 经 移动 到 局 


区 地 址 指定 的 扇 区 位 置 


! 的 磁盘 


于 Ready 状态 ， 或 是 发 生 了 错误 


在 进行 Read、Write、Read Check、Write Check 处 理 时 ， 发 生 位 盘 地 址 溢出 错 
误 


试图 向 只 读 磁 强 写 入 数 


在 进行 Read、Write、Read Check、Write Check 处 理 时 ， 位 盘 的 磁头 并 未 移动 


到 适当 的 位 置 


是 已 有 多 个 缓冲 区 文件 被 清 


。 或 是 在 Read 处 理 时 ， 处 理 尚 


结 引 


但 是 已 有 多 个 缓冲 区 文件 被 写 满 


试图 访问 并 不 存在 的 磁盘 


试图 访问 并 不 存在 的 柱 面 


试图 访问 并 不 存在 的 遍 


表 8-7 RKCS 


示 Seek 或 Reset 处 理 结束 


数据 时 防止 RKBA 的 值 递增 


式 化 时 置 1 


置 1 时 表示 当 软件 异常 时 终止 对 磁 副 的 操作 


过 向 量 0220 引发 


扩展 RKBA 的 地 址 。 设 定 为 内 存 中 待 传送 数据 的 18 比特 物理 地 址 的 高 位 2 比 
特 的 数据 。 当 RKBA 溢出 时 递增 


000 : Reset, 001: Write，010 : Read，011 : Write Check, 100: Seek, 101 
: Read Check, 110: Drive Reset，111 : Write Lock 


局 的 长 度 ( 


内 存 中 竺 传送 数据 的 物理 地 址 的 低位 16 比特 


表 8-10 RKDA 


下 编号 。 ( 块 编号 /12) >>1。 例 如 ， 当 块 编号 为 100 时 ， 
100/12=8(1000)，8(1000)>>1=4(100) 


盘面 编号 。 ( 块 编号 /12) &1。 例如 ， 当 块 编号 为 100 时 ， 
100/12= 8(1000)，8(1000)&1=0 


扇 区 地 址 (0~11) 。 块 编号 %12。 例 如 ， 当 块 编号 为 100 时 ，100%12=4 


在 控制 器 和 磁盘 间 传 输 数 据 时 使 用 


rkstrategy() 


rkstrategy() 是 对 RK 伺 盘 进行 读 写 的 范 数 ( 表 8-12， 代 码 清 单 8- 
5 ) 。 首 先 将 缓冲 区 追加 至 设备 处 理 队 列 的 末尾 ， 然 后 执行 
rkstart() 访问 RK 侯 盘 。 


表 8-12 rkstrategy() 的 参数 


代码 清单 8-5 rkstrategy() (dmr/rk.c) 


1 rkstrategy(abp) 

2 struct buf *abp; 

3 1 
register struct buf *bp; 
register *qc, *ql; 
int d; 


bp = abp， 

If(bp->b flags&B_PHYS ) 
mapalloc(bp); 

d = bp->b_dev.d_minor-7; 

if(d <= 0) 
d = 1; 

if (bp->b_blkno >= NRKBLK*d) { 
p->b_flags =| B_ERROR; 
odone (bp); 
eturn; 


bp->av_forw = 0; 

spl5(); 

if (rktab.d_actf==0) 
rktab.d_actf = bp; 

else 
rktab.d_actl->av_forw = bp; 

rktab.d_actl1 = bp; 

if (rktab.d_ active==0) 
rkstart(); 

sp10(); 


9~10 ”在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 

11~18 ”如 果 块 编号 的 值 过 大 则 引发 错误 。 如 果 小 编号 小 于 8， 则 
与 一 个 磁 一 能 够 拥有 的 最 大 块 编号 NRKBLK (4872) (代码 清单 
8-6) 进行 比较 。 大 于 等 于 8 时 与 (小 编号 -7) x4872 进行 比较 。 


代码 清单 8-6 NRKBLK (dmr/rk.c) 


1 #define NRKBLK 4872 


| 


19 “将 缓冲 区 的 末尾 设 为 0。 


20 ”将 处 理 器 优先 级 提升 至 5， 防 止 由 RK 引发 的 中 断 (中 断 优 
先 级 为 5) 。 


21~25 “如果 设 备 处 理 队 列 为 宝 ， 则 回 队 列 的 起 始 位 置 奶 加 缓冲 
区 。 如 琳 不 为 空 ， 则 将 缓冲 区 人 奶 加 至 末尾 位 置 。 


26~27 如果 rktab.d_active 为 0 (RK 未 处 于 处 理 状态 ) 则 
执行 rkstart() ， 开 始 对 RK 磁盘 进行 读 写 操作 。 


28 ”将 处 理 絮 优先 级 重 置 为 0。 
rkstart() 


rkstart() 是 启动 RK 磁盘 处 理 的 范 数 (代码 清单 8-7 ) 。 对 处 于 设 
备 处 理 队 列 起 始 位置 的 缓 神 区 进行 读 写 操作 。 


代码 清单 8-7 rkstart() (dmr/rk.c) 


rkstart() 
{ 
register struct buf *bp; 
return; 


rktab.d activet+; 
devstart(bp, &RKADDR->rkda, rkaddr(bp), 0); 


1 
2 
3 
4 
5 if ((bp = rktab.d_actf) == 0) 
6 
7 
8 
9 


} 


5~6 ”如 果 队 列 为 空 ， 则 不 做 任何 处 理 立 即 返 回 。 
7 递增 rktab ,d_active ， 表 示 RK 人 磁 一 处 于 处 理 中 的 状态 。 


8 执行 devstart() 启动 磁盘 处 理 。RKADDR 为 RK11-D 寄存 
器 的 基地 址 ，rkda 表示 基地 址 距 RKDA 地 址 的 差 值 (代码 清单 
8-8， 代 码 清单 8-9) 


代码 清单 8-8 ”RKADDR (dmr/rk.o) 


1 #define RKADDR ©0177400 


代码 清单 8-9 ”RK 寄存 器 参照 用 结构 体 (dmxr/rk.c) 


1 Struct { 
2 int 
3 int 
4 int 
5 Int 
6 int 
7 int 
8 


}; 


rkaddr() 


rkaddr() 利用 小 编号 和 块 编号 计算 用 于 赋予 RKDA 的 值 ( 表 8-13， 代 
码 清单 8-10 ) 。 计 算 内 容 请 参照 表 8-10。 


表 8-13 rkaddr0 的 参数 


代码 清单 8-10 rkaddr() (dmr/rk.c) 


1 rkaddr(bp) 
2 struct buf *bp; 


register struct buf *p; 
register int b; 
int d, m; 


bp; 

p->b_blkno; 

p->b_dev.d _ minor - 7; 
m <= 0 

d = p->b_dev.d_ minor; 


} 
return(d<<13 | (b/12)<<4 | b%12); 


14 lrenm 为 用 汇编 语言 编写 的 钞 数 ， 用 来 计算 余数 。 

15 1div 为 用 汇编 语言 编写 的 函数 ， 用 来 计算 商 。 
devstart() 
devstart() 利用 缓冲 区 中 设置 的 参数 ， 设 置 RKDA、RKBA 、 
RKWC、RKCS 并 启动 设备 的 处 理 ( 表 8-14， 代 码 清单 8-11 ) 。 当 
RKCS 的 第 0 比特 位 变 为 1 时 ， 表 示 已 启动 RK 人 磁盘 的 处 理 。 


devstart() 对 应 多 种 磁盘 设备 ， 可 以 说 它 是 在 第 7 章 介 绍 过 的 块 设 
备 子 系统 的 一 部 分 。 为 了 便于 说 明 ， 将 其 移 至 此 处 介绍 。 


表 8-14 devstart0 的 参数 


devloc RKDA 的 地 址 


1 devstart(bp, deviloc, devblk, hbconm) 


2 struct buf *bp; 
3 int *devloc; 


register int *dp; 
register struct buf *rbp; 
register int com; 


dp = devloc ; 
rbp = bp; 
*dp = devblk; 
*--dp = rbp->b_addr; 
*--dp = rbp->b_wcount; 
com = (hbcom<<8) | IENABLE | GO | 
((rbp->b_xmem & 03) << 4); 
if (rbp->b_flags&B_READ) 
com =| RCOM; 
else 
com =| WCOM; 
*--dp = com; 


9 ”将 dp 设 定 为 RKDA 的 地 址 。 


11 将 RKDA 设 定 为 通过 参数 传递 进来 的 值 。 


12 ”移动 dp 分 别 访问 RKBA、RKWC 和 RKCS。 将 RKBA 设 为 
缓冲 区 的 地 址 。 内 核 程序 中 的 数据 ， 其 虚拟 地 址 等 于 物理 地 址 


(参照 第 14 章 ) 
13” 设 定 RKWC 的 值 。 


14~20 ” 设 定 RKCS 的 值 。 代 码 清单 8-12 为 计算 时 使 用 的 参数 。 
图 8-4 表示 计算 的 内 容 。 因 为 内 核 程 序 使 用 数据 的 虚拟 地 址 等 于 物 
理 地 址 ， 且 物理 地 址 的 前 半 部 分 被 赋予 内 核 程 序 ， 所 以 
buf.b_xmenm 的 值 通常 为 0。 


代码 清单 8-12 设置 RKCS 时 使 用 的 参数 


1 #define CTLRDY 
2 #define 
3 #define 
4 #define 


5 #define 
6 #define RESET 


000000000 hbcom(0) << 8 
| 001000000 IENABLE 
| 000000001 GO 
| 000xx0000 (rbp->b_xmem & 03) << 4 


001xx0001 
读 入 时 
001xx0001 
| 000000100 RCOM 
O001xx0101 
写 入 时 
001xx0001 
| 000000010 WCOM 


O001xx0011 


图 8-4 赋予 RKCS 的 值 

rkintr() 

rkintr() 为 RK 磁盘 处 理 结束 时 引发 中 断 的 处 理 函 数 (代码 清 单 8- 
13 ) 。 它 从 设备 处 理 队 列 删除 位 于 头 部 的 缓冲 区 ， 并 再 次 执行 
rkstart()。 当 访问 RK 失败 时 进行 10 次 重 试 。 


对 于 已 结束 输入 输出 处 理 的 缓冲 区 来 说 ，B_DONE 标志 位 通过 
iodone() 设 定 。 异 步 访问 时 ， 在 此 处 进行 释放 缓冲 区 的 处 理 。 


代码 清单 8-13 rkintr0 (dmr/rk.c) 


1 rkintr() 

2 

3 register struct buf *bp; 
4 

5 if (rktab.d_active == 0) 
6 return; 

7 bp = rktab.d actf; 


8 rktab .d_ active = 0; 


9 if (RKADDR->rkcs < 0) { 

10 deverror(bp, RKADDR->rker, RKADDR->rkds); 
11 RKADDR->rkcs = RESET|GO; 

12 while( (RKADDR->rkcs&CTLRDY) == 0) ，; 
13 if (++rktab.d_errcnt <= 10) { 

14 rkstart(); 

15 return; 

16 } 

17 bp->b_flags =| B_ERROR; 

18 } 

19 rktab.d_errcnt = 0; 

20 rktab.d_actf = bp->av_forw; 

21 iodone(bp); 

22 rkstart(); 

23 } 


5~6 ”如 末 RK 磁盘 未 局 动 ， 则 不 直接 返回 。 
7 “从 设备 处 理 队列 取得 位 于 头 部 的 缓冲 区 。 


8 将 rktab,d_active 重 置 为 0。 


9~18 ”如 果 RKCS 的 错误 位 (第 15 比特 位 ) 为 1， 则 进行 下 述 处 
理 。 


。 调 用 deverror() 输出 错误 信息 
将 RESET 和 G0 赋予 RKCS， 使 磁盘 进行 Reset 处 理 


束 


递增 重 试 计数 妖 


如 有 果 重 试 计数 句 的 值 小 于 等 于 10 则 重 试 ， 否 则 设置 
buf.b_flags 的 错误 标志 位 


19 ”将 重 试 计数 絮 重 置 为 0。 


20 ”从 设备 处 理 队列 删除 位 于 头 部 的 缓冲 区 。 


21 执行 jodone( ) 设置 缓冲 区 的 处 理 结束 标志 位 
(B_DONE,) 


22 ”执行 rkstart() ， 开 始 处 理 设 备 处 理 队列 的 下 一 个 缓冲 


区 


RAW 输入 输出 

rkread() 和 rkwrite() 用 来 进行 RAW 输入 输出 。 这 两 个 函 数 在 字 
符 设备 驱动 表 中 注册 ， 使 RAW 输入 输出 使 用 的 缓冲 区 rrkbuf (代码 
清单 8-14 ) 为 参数 ， 调 用 physio() (代码 清单 8-15) 。 


代码 清单 8-14 rrkbuf (dmrrk.a 


1 struct buf rrkbuf， 


代码 清单 8-15  rkread0 ，rkwrite0 (dmr/rk.c) 


rkread( dev) 
{ 


physio(rkstrategy, &rrkbuf, dev, B_READ); 


rkwrite(dev) 


physio(rkstrategy, &rrkbuf, dev, B_WRITE); 


8.3 “小结 
。 每 种 块 设备 都 具有 与 其 相对 的 块 设备 驱动 


。 块 设备 驱动 由 bdevsw[] 管理 
。 大 编号 对 应 bdevsw[] 的 数组 下 标 
。 块 设备 驱动 拥有 设备 处 理 队 列 


第 V 部 分 文件 系统 


内 核 使 用 户 可 以 通过 文件 、 目 录 等 易于 理解 和 管理 的 概念 访问 块 设备 
上 的 数据 。 第 V 部 分 将 介绍 以 下 内 容 。 


。 如 何 使 用 块 设备 上 的 区 域 

。 内 核 如 何 管 理 块 设备 上 的 空间 区 域 
。 文件 的 实体 是 什么 

。 如 何 命 @ 并 管理 文件 

。 用 户 程 序 如 何 操作 文件 和 目录 


通过 阅读 本 部 分 的 内 容 ,对 读 写 文件 时 计算 机 内 部 发 生 的 处 理应 该 会 有 
比较 清晰 的 理解 。 


第 9 章 文件 系统 


9.1 什么 是 文件 系统 


文件 系统 是 结构 化 管理 块 设 备 上 的 数据 的 机 制 。 它 通过 文件 和 目录 等 
概念 ， 使 管理 设备 上 的 数据 成 为 可 能 。 


文件 是 为 了 管理 块 的 集合 而 定义 的 概念 。 文 件 本 身 通过 文件 名 管理 。 
为 了 防止 文件 名 的 重复 ， 同 时 给 用 户 提供 方便 ，UNIX V6 采用 了 树 状 
结构 的 命名 空间 。 目 录 通 过 文件 名 管理 文件 ， 它 在 本 质 上 征 与 文件 相 
同 的 概念 。 考 虑 到 会 有 多 个 用 户 使 用 系统 ， 可 以 设 定 文件 和 目录 的 访 
问 权 限 。 

由 于 存在 文件 系统 ， 用 户 无 需 对 块 设备 的 种 类 、 规 格 、 数 据 的 存放 地 
址 等 复杂 信息 有 任何 了 解 。 


在 利用 块 设备 的 文件 系统 前 需要 对 其 进行 挂 载 “mount) 。 即 使 挂 载 了 
多 个 块 设备 的 文件 系统 ， 对 用 户 而 言 也 是 透明 的 ， 在 数据 操作 方面 并 
无 任何 不 同 (图 9-1) 。 


文件 系统 
es 结构 化 4 实体 
口 文件 块 设备 1 
ER 
用 户 | 
2 | 
文件 - 挂 载 一 
目录 操作 
- 追加 
- 删除 
- 读 写 \ 块 设 备 
- 访 设 定 问 权限 ee 
\ en sl 
I ss ms 
WN ee ss 
| 有 


图 9-1 文件 系统 
inode 


文件 用 来 管理 块 设备 上 的 块 集合 ， 它 由 两 部 分 构成 ， 定 义 文件 的 inode 
和 该 文件 包含 的 数据 。inode 管理 文件 大 小 、 访 问 权 限 、 保 存 数据 的 块 
0 
inode ° 


inode 本 吴 也 保存 在 块 设备 中 。 系 统 内 核 将 inode 从 块 设备 读 取 至 内 存 
时 ， 为 了 便于 操作 ， 对 其 格式 进行 了 适当 的 改变 。 虽 然 在 阅读 内 核 代 
码 时 着 重 考虑 内 存 中 inode 的 格式 即 可 ， 但 应 该 注意 到 它 被 写 回 块 设备 
时 ， 其 数据 格式 是 不 同 的 ， 请 不 要 起 记 这 一 点 。 


树 状 结构 的 命名 空间 


系统 利用 树 状 结构 的 命名 至 间 赋予 文件 唯一 的 文件 名 。 文 件 和 目录 可 
以 通过 以 根 目 孙 为 起 点 的 绝对 路 径 ， 或 以 当前 目录 为 起 点 的 相对 路 径 


指定 。 


将 位 于 树 状 结构 顶点 的 目录 称 为 根 目 录 。 由 “起 始 的 路 径 为 绝对 路 
径 。 进 程 当 前 所 在 的 目录 称 为 当前 目录 ， 用 user .u_cdir 表示 。 如 
果 路 径 的 起 始 字 符 为 以 外 的 字符 ， 则 为 相对 路 径 。 男 外 ，“.' 表 示 对 和 象 
目录 本 身 ,“..* 表 示 对 象 目录 的 父 目录 (图 9-2) 。 


CO 目录 
[E41 文件 


绝对 目录 名 : /dir1/dir2/file 
相对 目录 名 : dir2/file 


块 设 备 的 文件 系统 通过 桂 载 操作 被 系统 识别 ， 反 之 ， 将 其 从 系统 中 解 
除 的 操作 即 为 凶 载 。 利 用 挂 载 和 季 载 ， 用 户 可 以 将 多 个 块 设 备 的 文件 


系统 ， 根 据 需 要 自由 地 追加 到 系统 中 ， 或 从 系统 中 解除 。 


为 了 进行 挂 载 ， 首 先 需 要 生成 与 块 设备 相对 的 特殊 文件 (special 
file) ， 并 利用 系统 调用 mount 将 该 文件 与 挂 载 点 (mount point) 进行 
关联 。 所 谓 挂 载 点 其 实 是 一 个 路 径 ， 被 挂 载 的 块 设备 的 文件 系 乡 充 将 以 
该 路 径 为 起 点 。 已 经 被 挂 载 的 块 设备 (的 文件 系统 ) 由 mount [] 管 
理 。 


访问 权限 


登录 到 系统 的 用 户 被 赋予 用 户 ID。 如 有 果 用 户 生 成 了 文件 ， 用 户 ID 和 该 
用 户 所 属 的 组 (group) 的 ID 将 会 被 记录 在 文件 里 。 
文件 的 访问 权限 通过 一 组 长 度 为 11 比特 的 数据 ( 称 为 权限 设 定 ， 
permission) 管理 ， 其 中 的 9 比特 分 别 对 文件 的 所 有 者 、 所 有 者 所 属 组 
的 用 户 以 及 其 他 用 户 的 读 写 和 执行 权限 做 了 定义 〈 表 9-1 ) 。 因 为 上 述 
各 类 用 户 的 权限 均 以 3 比特 表示 ， 所 以 文件 的 访问 权限 经 名 写成 0644 
或 0755 这 样 的 八进制 的 形式 。 


表 9-1 权限 设 定 


Ei 
文件 拥有 者 是 否 可 读 


否 可 写 


文件 拥有 者 所 


文件 拥有 者 所 属 组 是 否 可 以 执行 


、 


可 该 


-二 上 


他 用 户 是 否 
其 他 用 户 是 否 可 写 
他 用 户 是 否 


否 可 以 执行 


> 


权限 设 定 余 下 的 2 比特 中 ， 有 1 比特 称 为 SUID 。 当 它 被 置 为 1 时， 

在 文件 执行 时 用 户 ID 将 暂时 设置 为 文件 拥有 痢 的 用 户 ID。 画 有 1 比特 
称 为 SGID ， 当 它 被 置 为 1 时， 在 文件 执行 时 组 ID 将 暂时 设置 为 文件 
拥有 着 所 属 组 的 ID。 


user 结构 体 的 u_uid 和 u_ruid 用 来 管理 进程 的 用 户 ID，u_gid 和 
u_rgid 用 来 管理 组 ID。SUID 和 SGID 的 值 为 1 时， 在 程序 运行 时 
u_uid 和 u_gid 将 改变 ， 而 u_ruid 和 u_rgid 则 维持 原状 。 

此 ，u_uid 、u_gid 被 称 为 实效 用 户 ID 和 实效 组 ID，u_ruid 、 
u_rgid 则 被 称 为 实际 用 户 ID 和 实际 组 ID。 


user .u_uid 为 0 的 进程 称 为 超级 用 户 。 超 级 用 户 可 以 忽略 权限 设 定 
操作 所 有 文件 。 但 是 如 果 硕 望 执 行 某 个 文件 ， 必 须 事先 对 文件 拥有 
者 、 所 属 组 、 其 他 用 户 的 其 中 之 一 赋予 可 执行 该 文件 的 权限 。 


正 因 为 对 文件 和 目录 来 用 了 树 状 结构 进行 管理 ， 权 限 管理 也 相应 变 得 
容易 。 比 如 说 ， 可 以 很 方便 地 指定 除了 某 个 用 户 以 外 的 所 有 用 户 不 得 
访问 某 个 目 隶 。 假 设 没 有 采用 树 状 结构 进行 管理 的 话 ， 苞 怕 只 能 对 
个 文件 手动 设置 访问 权限 。 


根 磁盘 


对 系统 而 言 需 要 定义 一 个 根 磁盘 。 根 磁盘 的 文件 系统 在 启动 时 被 自动 
导入 系统 ， 它 保存 了 系统 内 核 程 序 和 用 于 控制 系统 的 用 户 程 序 


(Vetc/init 等 ) ， 这 些 程序 将 在 系统 局 动 时 执行 。 根 磁盘 以 外 的 块 
设备 的 文件 系统 可 在 司 动 后 挂 载 。 


根 磁 盘 通过 rootdev 来 指定 。 系 统管 理 者 需要 根据 实际 情况 更 改 
rootdev 的 设 定 ， 并 重新 生成 系统 内 核 。 代 码 清单 9-1 的 例子 中 将 
rootdev 的 大 编号 和 小 编号 同时 设 定 为 0。 如 果 bdevsw[] 按照 代码 
清单 8-2 设置 ， 那 么 小 编号 为 0 的 RK 磁盘 (驱动 器 ) 将 成 为 根 磁 盘 。 


代码 清单 9-1 rootdev (conf.c) 


1 int rootdev {(0<<8)|10}; 


9.2 ” 块 设备 的 区 域 


块 设 备 被 分 为 4 个 区 域 。 编 号 为 0 的 块 将 在 系统 局 动 时 投入 使 用 。 编 
号 为 1 的 块 称 为 超级 块 (superblock) ， 它 包含 了 该 设备 的 信息 。 其 后 
本 和 存储 区 域 。inode 区 域 和 存储 区 域 的 大 小 由 超级 块 
定义 (图 9-3) 。 


块 设 设备 一 


0 启动 区 域 用 于 启动 


2 


inode 区 域 和 存储 区 域 
的 长 度 由 超级 块 设 定 
存储 区 域 


图 9-3 块 设备 区 域 


当 系 统管 理 者 执行 用 户 程序 /etc/mkfs 时 ， 将 对 块 设备 的 各 区 域 进 
行 初始 化 处 理 。 


用 于 启动 的 区 域 


we 系统 启动 时 投入 使 用 ， 而 在 其 他 的 情况 下 不 会 被 使 
。 详细 请 参照 第 14 章 。 


超级 块 


编号 为 1 的 块 容纳 着 超级 块 的 信息 。 超 级 块 对 相应 块 设备 的 信息 进行 
管理 ， 用 于 获取 资源 及 排他 处 理 。 此 外 ， 超 级 块 通过 空 闪 队列 (free 
list) 管理 未 使 用 的 inode 和 属于 未 使 用 存储 区 域 的 块 。 新 生成 文件 

上 时， 内核 从 空 = 内 队列 获取 未 使 用 区 域 的 信息 。 反 之 ， 当 删 除 文件 时 ， 
将 文件 占用 的 区 域 返 还 给 空闲 队列 。 超级 块 的 内 容 通过 filsys 结构 
体 定义 (代码 清单 9-2， 表 9-2 ) 。 


代码 清单 9-2 ”filsys 结构 体 (filsys.h) 


数据 


truct filsys 


s 
{ 


int s_isize; 

int s_fsize; 

int s_nfree; 

int s_free[100]; 
int s_ninode; 
int s_inode[100]; 
char s_flock; 
char s_ilock; 
char s_fmod; 

char s_ronly; 

int s_time[2]; 
int pad[50]; 


表 9-2 ”filsys 结构 体 


pe 队列 中 的 有 外 元 娄 修 


存储 空闲 队列 

inode 空 几 队列 中 的 有 效 元 素 个 数 
inode 空间 队 列 
存储 空闲 队列 的 锁 


inode 宇 亲 队列 的 


这 里 的 原文 有 误 。s fsize 指 的 应 该 是 块 设备 全 体 (包括 编号 为 0 的 块 ， 超 级 块 ，inode 
区 域 和 存储 区 域 】 的 块 数 。 一 一 译 者 注 


inode 区 域 


从 编号 为 2 的 块 开始 是 长 度 为 filsys,s_isize 个 块 的 inode 区 域 。 
inode 区 域 用 来 保存 inode。inode 中 有 文件 的 定义 ，1 个 inode 对 应 1 
个 文件 。 


inode 具有 inode 编号 。 从 位 于 inode 区 域 起 始 位 置 的 inode 开始 ， 依 次 
赋予 1、2、3...... 的 编号 。inode 的 长 度 为 32 字 节 ，1 个 块 (512 字 
节 ) 可 容纳 16 个 inode。 具 有 某 个 inode 编号 的 inode 所 在 的 块 可 表示 
为 (inode 编号 +31 ) /16 〈 回 下 取 整 ) ， 块 中 的 偏 移 量 可 表示 为 32x 

( (inode 编 号 +31) %16) (图 9-4) 。 


pp 


块 设备 1 个 块 =512 字 节 1 个 inode=32 字 节 偏 移 量 


0 启动 区 域 
inode1 0 
1 超级 块 


2 > 
inode 区 域 Se 


诸 区 坪 
- 


例如 ，inode 编号 为 18 的 inode， 位 于 ( 18+31 ) /16= 第 3 个 块 
的 第 32x (( 18+31 ) %16 ) =32 个 字 节 处 


图 9-4 inode 区 域 


块 设备 中 inode 的 数据 形式 由 ino.,h 中 的 inode 结构 体 定义 〈 代 码 清 
单 9-3， 表 9-3 ) 。 该 结构 体 包 括 文件 长 度 、 权 限 、 更 新 时 间 、 数 据 所 
在 地 址 等 数据 。 请 注意 ，inode 中 不 包含 文件 名 。 


如 前 所 述 ， 内 存 中 inode 的 数据 形式 和 有 不 同 。 内 存 中 的 inode 由 
inode.h 中 的 inode 结构 体 定义 ， 详 细 请 参照 后 文 。 内 核 不 会 使 用 
ino.h 中 定义 的 inode 结构 体 ， 而 一 部 分 对 文件 系统 进行 操作 的 用 户 
程序 将 使 用 该 结构 体 。 


代码 清单 9-3 ”inode 结构 体 (ino.h) 


1 struct inode 
2 

3 int i _ mode; 
4 char i _nlink; 
5 char i_uid; 

6 char i_gid; 


7 char i size0; 


8 char *i_ SIze1， 

9 int i_addr[8]; 
10 int i atime[2]; 
11 int i _ mtime[2]; 
12 }; 

13 


14 /* modes */ 

15 #define IALLOC 0100000 
16 #define IFMT 060000 
17 #define IFDIR 040000 
18 #define IFCHR 020000 
19 #define IFBLK 060000 
20 #define ILARG 010000 
21 #define ISUID 04000 
22 #define ISGID 02000 
23 #define ISVTX 01000 
24 #define IREAD 0400 
25 #define IWRITE 0200 
26 #define IEXEC 0100 


表 9-3 inode 结构 体 


状态 、 控 制 信息 。 低 位 9 比特 表示 权限 。 


长度 的 高 位 8 比 和 


*T SiZel 牛 长 度 的 低位 16 比特 


2 
倒 


见 表 9-4 


的 存储 区 域 的 块 编 


参照 时 间 。inode.h 中 的 inode 结构 体 不 包含 此 成 员 
新 时 间 ° inode .h 1 的 inode 结构 体 不 包含 此 成 员 


表 9-4 inode 的 模式 


I 
当前 inode 已 被 分 
字符 特殊 文件 


pe 较 大 ， 使 用 


IREAD 读 取 权 限 


存储 区 域 


存储 区 域 位 于 inode 区 域 后 方 ， 其 长 度 由 filsys.s_fsize ”定义 。 
存储 区 域 保 存 着 文件 中 的 数据 。 


里 的 原文 有 误 。 请 参照 p190 的 译 者 注 。 一 一 译 者 注 
inode .i_addr[] 表示 某 个 文件 究竟 使 用 着 存储 区 域 的 哪 一 个 块 。 文 


件 使 用 的 块 不 一 定 是 连续 的 ， 但 是 从 用 户 的 角度 来 看 ， 文 件 可 以 被 看 
做 是 占用 了 一 块 连续 的 区 域 (图 9-5 ) 。 


法 


存储 区 域 


该 文件 数据 
inode.i_addr[ ] 占用 的 块 


某 个 文件 的 inode 


图 9-5 inode 和 存储 区 域 


9.3” 挂 载 
mount 结构 体 


被 挂 载 的 块 设备 (的 文件 系统 ) 通过 mount 结构 体 的 数组 mount[] 
进行 管理 (代码 清单 9-4， 代 码 清单 9-5, 表 9-5) 。 


挂 载 块 设备 的 文件 系统 之 后 ， 将 被 分 配 新 的 mount[] 的 元 素 。 将 
mount .m_dev 设 定 为 该 块 设备 的 设备 编号 ， 代 表 挂 载 点 的 ijnode[] 
元 素 \inode[] 用 于 管理 读 取 至 内 存 的 inode。 详 细 请 参见 下 文 ) 通 
过 mount.m_inodep 指定 。 设 置 代 表 挂 载 点 的 tnode[] 元 素 的 
IMOUNT 标志 人 位， 表示 该 元 素 为 挂 载 点 。 此 外 ， 超 级 块 的 数据 拷贝 至 
NODEYV 块 设备 缓冲 区 ， 通 过 mount ,m_bufp 可 访问 该 缓冲 区 。 


内 核 在 遍历 文件 路 径 时 ， 如 果 遇 到 挂 载 点 ， 将 取得 相应 的 mount [] 元 
素 ， 然 后 移动 到 被 挂 载 的 块 设备 的 根 目 录 。mount[] 用 于 关联 挂 载 点 
和 被 挂 载 的 设备 (图 9-6) 。 


代码 清单 9-4 mount (system.h) 


代码 清单 9-5 NMOUNT (param.h) 


1 #define NMOUNT 5 


表 9-5 _ mount 结构 体 


嗓 冲 区 容纳 着 被 复制 的 超级 块 的 数 


inode.i_flag: IMOUNT 块 设 备 1 


We 
7 


i 
i SN 
5 块 设备 2 


块 设备 2 的 根 目 录 


mount[] 


这 两 个 对 象 通过 
mount[] 进行 关联 


图 9-6 挂 载 


系统 调用 mount 

系统 调用 mount 用 于 挂 载 块 设备 ， 并 向 mount[] 元 素 追 加 块 设备 的 
信息 。 系 统 调用 mount 具有 3 个 参数 ， 分 别 为 与 挂 载 设备 对 应 的 特殊 
文件 的 路 径 、 挂 载 点 的 路 径 和 读 写 标志 。 


系统 调用 首先 检查 特殊 文件 的 路 径 是 否 恰当 ， 此 处 理 调用 getmdev() 
。 如 果 路 径 恰 当 则 返回 设备 编号 。 此 外 ， 确 认 挂 载 点 当前 没有 任何 人 
访问 ， 并 确认 不 是 字符 设备 的 特殊 文件 。 


此 后 ， 从 mount[] 中 寻找 空 的 元 素 ， 并 对 该 元 素 进行 初始 化 处 理 。 然 
后 为 代表 挂 载 点 的 jnode[ ] 元 素 设 置 IMOUNT 标志 位 。 


smount ( ) 是 系统 调用 mount 的 处 理 函 数 ( 表 9-6， 代 码 清单 9-6 


表 9-6 系统 调用 mount 的 参数 


二 点 的 中 人 
读 写 标志 。 如 果 为 1， 表示 以 只 读 方 式 挂 载 


代码 清单 9-6 ”smount(0(ken/sys3.a 


1 

2 

3 int d; 

4 register *ip; 

5 register struct mount *mp, *smp; 
6 extern uchar; 

7 

8 d = getmdev(); 

9 if(u.u_error) 
10 return; 
11 Uu.u_dirp = u.u_arg[1]; 
12 ip = namei(&uchar, 0); 
13 if(ip == NULL) 
14 return; 
15 if(ip->i count!=1 || (ip->i mode&(IFBLK&IFCHR))!=0) 


16 goto out,; 


17 smp = NULL; 


18 for(mp = &mount[0]; mp < &mount[NMOUNT]， mp++) { 
19 if(mp->m_bufp != NULL) { 
20 if(d == mp->m_dev) 

21 goto out ; 

22 } else 

23 if(smp == NULL) 

24 smp = mp; 

25 

26 if(smp == NULL) 

27 goto out; 

28 (*bdevsw[d.d_ major].d_open)(d, !'u.u_arg[2]); 
29 if(u.u_error) 

30 goto out; 

31 mp = bread(d, 1); 

32 if(u.u_error) { 

33 brelse(mp); 

34 goto out1; 

35 } 

36 smp->m_inodp = ip; 

37 smp->m_dev = d; 

38 smp->m_bufp = getblk(NODEV); 
39 bcopy(mp->b_addr, smp->m_bufp->b_addr, 256); 
40 smp = smp->m_bufp->b_addr; 

41 smp->s_ilock = 0; 

42 smp->s_flock = 0; 

43 smp->s_ronly = u.u_arg[2] & 1; 
44 brelse(mp); 

45 ip->i flag =| IMOUNT; 

46 prele(ip); 

47 return; 

48 

49 out: 

50 U,.U_error = EBUSY; 

51 out1: 

52 iput(ip); 

53 } 


8~10 ”执行 getmdev( ) 取得 准备 挂 载 的 块 设备 的 大 编号 。 


11~14 ”取得 代表 挂 载 点 的 Inode[] 元 素 。 


15~16 ”确认 无 人 访问 代表 挂 载 点 的 inode[ ] 元 系 ， 同 时 确认 该 
元 素 不 为 字符 设备 或 块 设备 的 特殊 文件 。 


17~27 “寻找 mount[] 中 未 使 用 的 元 素 。 如 果 不 存 在 未 使 用 元 
素 ， 或 者 准备 挂 载 的 设备 已 被 挂 载 ， 则 认为 出 错 。 


28~30 ”进行 打开 挂 载 设备 的 处 理 。 

31~35 ”将 挂 载 设备 的 超级 块 读 入 缓冲 区 。 

36~43 ”对 所 取得 的 mount[] 元 素 进 行 初始 化 处 理 。 通 过 
getblk( ) 取得 尚未 分 配给 任何 设备 的 块 设备 缓冲 区 。 将 挂 载 设 
备 的 超级 块 的 数据 复制 到 该 缓冲 区 ， 并 注册 到 mount [ ] 元 素 。 
44 ”释放 读 取 超级 块 的 缓冲 区 。 

45 ”设置 代表 挂 载 点 的 inode[] 元 素 的 IMOUNT 标志 位 。 

46 ”解除 代表 挂 载 点 的 jnode[] 元 素 的 锁 。 


getmdev() 


getmdev( ) 是 执行 smount() 和 sumount() 共用 处 理 的 函数 (代码 
清单 9-7 ) 。 该 函数 首先 检查 作为 系统 调用 第 1 个 参数 的 特殊 文件 的 路 


径 是 否 合适 ， 如 果 合 适 ， 则 返回 该 设备 的 设备 编号。 


代码 清单 9-7 getmdev() (ken/sys3.c) 


1 getmdev() 

2 

3 register d, *ip; 

4 extern uchar; 

5 

6 ip = namei(&uchar, 0); 

7 if(ip == NULL) 

8 return; 

9 if((ip->i mode&IFMT) != IFBLK) 
10 U.Uu_error = ENOTBLK; 
11 d = ip->i_addr[0]; 

12 if(ip->i_addr[0].d major >= nblkdev) 
13 u.u_error = ENXIO; 

14 iput(ip); 

15 return(d); 


| 


6~8 ”取得 与 用 户 输入 的 第 1 个 参数 的 路 径 相对 应 的 jnode[] 元 


力 、 


9~10 ”如 果 不 为 块 设备 的 特殊 文件 则 出 错 。 

11 ”特殊 文件 的 inode.i_addr[0] 中 保存 着 设备 编号 。 

12~13 “如果 设备 的 大 编号 的 值 过 大 则 出 错 。 

14~15 ”释放 inode[] 元 隶 ， 返 回 设备 编号 。 
系统 调用 umount 


系统 调用 umount 用 于 外 载 指定 块 设备 的 文件 系统 。 它 从 mount[] 中 
释放 相应 元 素 ， 并 清除 代表 挂 载 点 的 jnode[] 元 素 的 IMOUNT 标志 
， 。 但 是 ， 如 果 谁 备 卸 载 的 设备 仍 处 于 使 用 中 的 状态 ， 则 中 断 卸 载 处 
了 理 。 


sumount ( ) 为 系统 调用 umount 的 处 理 画 数 〈 表 9-7， 代 码 清单 9-8 
) 。 系 统 调 用 umount 的 参数 为 挂 载 点 的 路 径 。 


表 9-7 系统 调用 umount 的 参数 


代码 清单 9-8 sumount() (ken/sys3.c) 


1 sumount() 

2 

3 int d; 

4 register struct inode *ip; 
5 register struct mount *mp; 


6 
7 Update( ); 
8 d = getmdev(); 


9 if(u.u_error) 

10 return; 

11 for(mp = &mount[0]; mp < &mount [NMOUNT]; mp++) 
12 if(mp->m_bufp!=NULL && d==mp->m_dev) 
13 goto found; 

14 uU.U_error = EINVAL,; 

15 return; 

16 

17 found: 

18 for(ip = &inode[0]; ip < &inode[NINODE]; ip++) 
19 if(ip->i_number!=0 && d==ip->i dev) { 
20 Uu.Uu_error = EBUSY; 

21 return; 

22 } 

23 (*bdevsw[d.d major].d_close)(d, 0); 

24 ip = mp->m_inodp; 

25 ip->i_flag =& ~IMOUNT; 

26 iput(ip); 

27 ip = mp->m_bufp; 

28 mp->m_bufp = NULL; 

29 brelse(ip); 

30 } 


7 ， 邯 载 前 和 多 将 内 存 中 的 数据 保存 至 块 设备 。 


8~10 ”取得 准备 御 载 的 设备 的 设备 编号 。 
11~15 ”在 mount[] 中 寻找 与 印 载 设备 相对 应 的 元 素 。 


18~22 在 inode[] 中 寻找 属于 秋 载 设备 的 元 素 。 如 果 存 在 则 说 
明 该 设备 仍 处 于 使 用 中 的 状态 ， 此 时 将 终止 和 载 处 理 。 


23 ”进行 关闭 凶 载 设备 的 处 理 。 


24~26 ”清除 与 挂 载 点 相对 的 inode [ ] 元 素 的 IMOUNT 标志 位 ， 
并 释放 该 元 素 。 


27~28 ”释放 mount[] 元 素 。 


释放 块 设备 缓冲 区 ， 该 缓冲 区 容纳 着 被 外 载 设备 的 超级 块 的 


9.4 inode 的 获取 和 释放 


inodef[] 


内 存 中 的 inode 通过 inode 结构 体 的 数组 ijnode[] 管理 (代码 清单 
9-9， 代 码 清单 9-10， 表 9-8 ) 。 此 处 的 inode 结构 体 由 ijnode.h 定 
义 ， 代 表 被 读 取 至 内 存 的 inode 的 数据 结构 。 


内 核 从 块 设备 读 取 inode 的 数据 并 将 其 转换 为 jnode[] 数组 元 系 的 形 
式 ， 通 过 操作 该 元 素 实 现 对 inode 的 操作 。inode[] 元 素 以 设备 编号 
和 inode 编号 进行 命名 。 所 有 块 设 备 的 inode 由 同一 个 inode[] 管 
理 。 此 外 ，inode[] 元 素 通 过 参照 计数 絮 来 记 杂 该 元 素 是 否 处 于 使 用 
中 的 状态 (图 9-7) 。 


周边 设备 


块 设备 1 ( 设备 编号 =devA ) 
inodel] | 的 inode 区 域 


内 核对 inodel 元 素 

进行 操作 
| inode 编号 4 | 
| inode 编号 5 | 
| inode 编号 6 | 


inode 编号 2 


块 设备 2 ( 设备 编号 =devB ) 
的 inode 区 域 


图 9-7 inodef] 


inodef[] 可 以 起 到 缓存 的 作用 。inode[] 中 的 某 个 元 素 即 使 不 再 使 
用 也 不 会 马上 被 删除 。 在 该 元 隶 再 次 被 其 他 inode 使 用 之 前 ， 其 数据 仍 
然 保存 在 inode[] 中 。 因 此 ，inode[] 中 保存 着 当前 正在 使 用 的 
inode， 以 及 最 近 曾 经 使 用 过 的 inode 的 数据 。 当 所 需 的 inode 在 
inode[] 中 存在 时 ， 无 需 再 从 块 设备 中 读 取 。 


此 外 ， 通 过 对 inode[] 元 素 进 行 排他 处 理 ， 可 以 防止 多 个 进程 操作 同 
= 人 9| 肥 的 全 突 信 


代码 清单 9-9 inode (inode.h) 


Struct Inode 

{ 
char i_flag; 
char i _count,; 
int i_dev; 
int i_number; 
int i_mode; 
char i_nlink; 
char i _uid; 
char i_gid; 
char i_ size0; 
char *i_ Sizel; 
int i addr[8]; 
int i_ lastr; 

} inode[NINODE]; 


OOOOORODP 


/* flags */ 
#define ILOCK 
#define IUPD 
#define IACC 
#define IMOUNT 
#define IWANT 
#define ITEXT 


/* modes */ 

#define IALLOC 0100000 
#define IFMT 060000 
#define IFDIR 040000 
#define IFCHR 020000 
#define IFBLK 060000 
#define ILARG 010000 
#define ISUID 04000 
#define ISGID 02000 
#define ISVTX 01000 
#define IREAD 0400 
#define IWRITE 0200 
#define IEXEC 0100 


代码 清单 9-10 NINODE (param.h) 


1 #define NINODE 100 


| 


表 9-8 inode 结构 体 


。 参照 表 9-9。 在 ino.h 中 定义 的 inode 结构 体 中 不 存在 此 成 员 


四 计数 器 。 在 ino.h 中 定义 的 inode 结构 体 中 不 存在 此 成 员 
3 在 inoh 中 证 义 的 inode 结构 体 中 不 存在 此 成 


i 用 的 元 素 。 在 ino.h 中 定义 的 inode 结构 体 
x 外 
状态 、 控 制 信息 。 低 位 9 比特 表示 权限 。 参 照 表 9-4 


0 
= 
文件 长 度 的 高 位 8 比特 
文件 长 度 的 低位 16 比特 
使 用 的 存储 区 域 的 块 编号 


i_lastr 在 此 之 前 读 取 的 逻辑 块 编号 。 用 于 预 读 取 功 能 。 在 ino.h 中 定义 的 inode 
守 结构 体 中 不 存在 此 成 员 


表 9-9 inode 的 标志 位 


给 进程 


iget() 
iget() 用 于 取得 inode[] 元 素 ( 表 9-10， 代 码 清 单 9-11 ) 。 


如 果 inode[] 中 不 存在 所 需要 的 元 素 ， 则 获取 新 的 元 素 并 命名 ， 然 后 
将 从 块 设备 读 取 的 inode 的 数据 复制 到 上 述 新 元 素 ， 并 返回 该 元 素 。 


如 果 inode[] 中 存在 所 需要 的 元 素 ， 递 增 参照 计数 器 并 返回 该 元 素 。 
由 于 无 需 读 取 块 设备 处 理 速 度 也 相应 提高 。 但 是 如 果 该 元 素 处 于 被 加 
锁 的 状态 ， 则 进入 睡眠 状态 直至 元 素 被 解锁 。 

如 果 设 置 了 inodef[] 元 素 的 IMOUNT 标志 位 ， 则 取得 mount [] 元 
素 ， 并 返回 与 对 应 设备 的 根 目 录 相 对 应 的 inodef[ ] 元 素 。 通 过 该 处 
理 ， 使 得 利用 同一 命名 空间 管理 多 个 挂 载 设备 成 为 可 能 。? 


3 即使 得 在 同一 个 目录 树 下 同时 载 入 多 个 挂 载 设备 的 根 目录 成 为 可 能 。 审 校 者 注 


表 9-10 ”iget0 的 参数 


代码 清单 9-11 iget() (ken/iget.c) 


1 iget(dev, ino) 

2 

3 register struct inode *p; 

4 register *ip2; 

5 Int *ip1; 

6 register struct mount *ip; 

7 

8 loop: 

9 ip = NULL; 
10 for(p = &inode[0]; p < &inode[NINODE]; p++) { 
11 if(dev==p->i_dev && ino==p->i_number) { 
12 if((p->i flag&ILOCK) != 0) { 
13 p->i_flag =| IWANT; 
14 sleep(p, PINOD); 
15 goto loop; 
16 } 
17 if((p->i flag&IMOUNT) != 0) { 
18 for(ip = &mount[0]; ip < &mount [NMOUNT]; ip++) 
19 if(ip->m_inodp == p) { 
20 dev = ip->m_dev; 
21 ino = ROOTINO; 
22 goto loop; 
23 } 
24 panic("no imt"); 
25 
26 p->i_count++; 
27 p->i_flag =| ILOCK.; 
28 return(p); 
29 } 
30 if(ip==NULL && p->i_count==0) 
31 ip = p; 
32 


} 
33 if((p=ip) == NULL) { 


34 printf("Inode table overflow\n"); 


35 U,.U_error = ENFILE,; 

36 return(NULL); 

37 } 

38 p->i_dev = dev; 

39 p->i_number = ino; 

40 p->i_flag = ILOCK; 

41 p->i_count++; 

42 p->i_lastr = -1; 

43 ip = bread(dev, ldiv(ino+31,16)); 
44 if (ip->b_ flags&B_ERROR) { 
45 brelse(ip); 

46 iput(p); 

47 return(NULL); 

48 } 

49 ip1 = ip->b_addr + 32*lrem(ino+31, 16); 
50 ip2 = &p->i_mode; 

51 while(ip2 < &p->i addr[8]) 
52 *ip2++ = *1ip1l++; 

53 brelse(ip); 

54 return(p); 

55 } 


10 “从 起 始 位 置 遍 历 inode[] ， 寻 找 未 使 用 的 元 素 。 同 时 确认 
对 象 元 素 是 否 在 inode[ ] 中 已 存在 。 


11 ”找到 与 参数 dev、ino 相对 应 的 元 素 时 的 处 理 。 


12~16 ”如 果 对 象 元 素 被 加 锁 ， 则 设置 IWANT 标志 位 (表示 存在 
等 待 该 Inode[ ] 元 素 的 进程 ) 并 进入 睡眠 状态 。 唤 醒 后 返回 
loop 再 次 尝试 。 

17~25 ”如 有 果 设 置 了 IMOUNT 标志 位 ， 则 从 mount[] 找到 对 应 的 
元 素 ， 将 dev 设 定 为 被 挂 载 设备 的 设备 编号 ， 将 ino 设 定 为 
ROOTINO (1) ， 然 后 返回 loop 并 再 次 尝试 。ROOTINO 表示 根 
目录 的 inode 编号 (代码 清单 9-12) 。 


代码 清单 9-12 ROOTINO (param.h) 


1 #define ROOTINO 1 


| 


26~28 “如果 对 象 元 素 既 未 被 加 锁 ， 也 没有 设置 IMOUNT 标志 位 的 
话 ， 递 增 该 元 素 的 参照 计数 器 并 加 锁 ， 然 后 返回 该 元 素 。 


30~31 将 inode[] 中 距 起 始 位 置 最 近 的 未 使 用 元 素 赋 予 ijp 。 


33~37 ”如 采 在 jnode[] 中 未 找到 与 参数 dev、ino 相对 应 的 元 
素 ， 且 inode[] 中 不 存在 未 使 用 元 素 时 ， 按 出 错 处 理 。 


38~42 ”为 ijnode[] 中 未 使 用 的 元 素 命 名 。 瘦 增 参照 计数 万 并 对 
该 元 素 加 锁 (同时 清除 其 他 标志 位 ) ， 然 后 将 预 读 取 逻 辑 块 编号 
设置 为 -1 (无 效 ) 。 

43 ” 读 取 块 设备 中 该 inode 所 在 的 块 。 

44~48 ”在 读 取 块 设备 发 生 错 误 时 进行 错误 处 理 。 


49~52 ”将 块 设备 中 inode 的 i_mode 至 i_addr 数据 复制 到 
inode[] 元 素 。 


53~54 ”释放 缓冲 区 ， 返 回 inode[] 元 素 。 
iput() 
iput( ) 用 来 递减 inode[] 元 素 的 参照 计数 器 的 值 ( 表 9-11， 代 码 清 
单 9-13 ) 。 当 参照 计数 器 的 值 为 0 时， 将 inode[] 元 素 的 内 容 写 回 
块 设备 。 此 外 ， 当 文件 不 再 被 任何 目录 参照 时 进行 删除 文件 的 处 理 。 
文件 的 删除 处 理 包含 以 下 内 容 。 

。 执 行 itrunc() ， 释 放 使 用 中 的 存储 区 域 ， 将 文件 长 度 和 


inode.i addr[] 清 0 


。 将 inode.i mode 清 0 


。 执 行 ifree() ， 将 inode 编号 返还 至 空间 队列 


表 9-11 iput0 的 参数 


代码 清单 9-13 iput(0) (ken/iget.c) 


1 iput(p) 
2 struct inode *p; 
3 1 


register *rp; 


rp = py， 
if(rp->i count == 1) { 
rp->i_flag =| ILOCK; 
if(rp->i_ nlink <= 0) { 
itrunc(rp); 
rp->i_mode = 0; 
ifree(rp->i dev, rp->i_number); 


iupdat(rp, time); 
prele(rp); 
rp->i_flag = 0; 
rp->i_number = 0; 


} 
rp->i_count--; 
prele(rp); 


7 ”递减 jnode[] 元 素 参 照 计数 器 的 值 ， 使 其 变 为 0 时 的 处 理 。 
8 将 inodef[] 元 素 加 锁 。 

9~13 ” 当 文 件 不 再 被 任 何 目 录 参 照 时 进行 删除 文件 的 处 理 。 

14 将 inode[] 元 素 的 数据 写 回 块 设备 。 


15 将 inode[] 元 素 解 锁 。 
16~17 将 inode[] 元 素 的 二 flag 和 inumber 清 0。 
19 ”递减 参照 计数 器 的 值 。 


20 将 inode[] 元 素 解 锁 。 这 是 针对 在 iput() 之 外 加 锁 的 处 
理 。 


iupdat() 
iupdat() 将 inode[] 元 素 的 内 容 写 入 块 设备 ( 表 9-12， 代 码 清单 


9-14 ) 。 写 入 处 理 只 在 设置 了 inode[] 元 素 的 更 新 标志 位 (IUPD ) 
或 参照 标志 位 (IACC ) 时 才 会 进行 。 


表 9-12 iupdat0 的 参数 


i 


代码 清单 9-14 iupdat0 (ken/iget.c) 


1 iupdat(p, tm) 


2 int *p; 

3 int *tm 

4 

5 register *ip1i, *ip2, *rp; 

6 int *bp, i; 

7 

8 rp = Pp 

9 if((rp->i_flag&(IUPD|IACC)) != 0) { 
10 if(getfs(rp->i dev)->s_ronly) 
11 return; 
12 i = rp->i_number+31; 


13 bp = bread(rp->i_ dev, ldiv(i,16)); 


14 ip1 = bp->b_addr + 32*lrem(i, 16); 


15 ip2 = &rp->i_mode; 

16 while(ip2 < &rp->i_addr[8]) 
17 *ip1i++ = *ip2++; 
18 if(rp->i_flag&IACC) { 
19 *ipi++ = time[0]; 
20 *ipi++ = time[1]; 
21 } else 

22 ip1 =+ 2; 

23 if(rp->i S01 { 
24 *ip1i++ = *tm++; 

25 *ipi++ = *tm; 

26 } 

27 bwrite(bp); 

28 

29 } 


9 ”更 新 标志 位 或 设置 参照 标志 位 时 的 处 理 。 
10~11 ”执行 getfs( ) 读 取 超级 块 ， 如 果 为 只 读 则 直接 返回 。 
12~13 ”从 块 设 备 中 读 取 inode 所 在 的 块 。 


14~17 ”更 新 位 于 块 设 备 中 的 inode， 更 新 的 范围 为 i_mode 至 


i addr 。 

18~20 ”如 条 设置 了 参照 标志 位 ， 则 更 新 inode 的 参照 时 间 。 
23~26 ”如 果 设 置 了 更 新 标志 位 ， 则 更 新 inode 的 更 新 时 间 。 

27 ”执行 bwrite()， 将 包括 已 更 新 的 inode 在 内 的 块 写 入 块 设 


O 〇 


9.5 inode 与 存储 区 域 的 对 应 关系 


某 个 文件 使 用 的 存储 区 域 的 块 由 inode,i_addr[] 管理 。inode 与 存 
储 区 域 存 在 下 述 3 种 对 应 关系 。 


。 直接 参照 


。 间接 参照 
。 双重 间接 参照 


上 述 3 种 参照 方法 能 够 管理 的 文件 长 度 依次 增 大 。 直 接 参 照 在 inode 的 

ILARG 标志 位 为 0 时 使 用 ， 存 储 区 域 的 块 编 号 直接 保存 于 

inode.i_ addr[] 中 。 将 文件 中 希望 访问 的 字 节 偏 移 量 N 除 以 512 
(= 块 长 度 ) 时 的 商用 b 来 表示 。 (ILARG 标志 位 为 0 时 ) b 一 定 小 于 

或 等 于 7，i_addr[b] 中 保存 着 相应 的 块 编号 。 直 接 参 照 能 够 管理 的 

最 大 文件 长 度 为 512 字 节 x8 = 4KB (图 9-8) 。 


间接 参照 适用 于 inode 的 ILARG 标志 位 为 1 的 情况 ， 且 前 述 的 b 除 以 
256 (1 个 字 x256 = 512 字 节 ) 的 商 小 于 等 于 6。 如 果 将 b 除 以 256 的 
商 记 为 i，inode .i_addr[i] 则 保存 着 作为 间接 参照 块 的 存储 区 域 中 
的 块 编号 。 前 述 N 的 除法 运算 得 到 的 余数 可 以 决定 间接 参照 块 中 的 偏 
移 量 ， 其 中 容纳 着 保存 目标 数据 的 存储 区 域 的 块 编号 。 间 接 参 照 所 能 
管理 的 最 大 文件 长 度 为 512 字 节 x256x7 = 896KB 。 


双重 间接 参照 适用 于 inode 的 ILARG 标志 位 为 1， 且 前 述 的 i 的 值 为 7 

的 情况 。inode.i_addr[7] 容纳 着 间接 参照 块 的 起 始 地 址 ， 而 间接 

参照 块 的 各 个 数据 又 分 别 指向 双重 间接 参照 块 的 地 址 。 双 重 间接 参照 

在 理论 上 可 以 管理 的 文件 长 度 为 512 字 节 x256x256 = 32MB (再 加 上 通 

过 inode.i_addr[6-0] 的 间接 参照 管理 的 896KB) ， 但 是 由 于 文件 

i 24 比特 的 形式 保存 的 ， 因 此 实际 上 只 能 管理 16MB 的 文件 
9-9) 。 


存储 


[] 


Inode._addr 


图 9-8 直接 参照 


inode.i_addrl] 存储 区 域 


inode.i_addr[0~6] 
为 间接 参照 
inode.L_addr[7] 
为 双重 间接 参照 


图 9-9 间接 参照 


在 之 后 的 说 明 中 ， 会 将 通过 文件 的 字 世 偶 移 量 除 以 512 的 商 得 到 的 其 
逻辑 块 编 号 ， 将 实际 保存 数据 的 存储 区 域 的 块 编号 称 为 物理 
编 亏 。 


bmap() 


逻辑 块 编号 变换 为 物理 块 编号 的 芳 数 ( 表 9-13， 代 码 清 
9-15) 。 


表 9-13 bmap0 的 参数 


代码 清单 9-15 bmap0 (ken/subr.c) 


1 bmap(ip, bn) 
2 struct inode *ip; 


3 int bn; 

4 

5 register *bp, *bap, nb; 
6 int *nbp, d, i; 

7 

8 d = ip->i_dev; 

9 if(bn & ~077777) { 

10 U,.U_error = EFBIG; 
11 return(0); 

12 } 

13 

14 /* 直接 参照 */ 

15 if((ip->i_mode&ILARG) == 0) { 
16 if((bn & ~7) != 0 


17 if ((bp = alloc(d)) == NULL) 
18 return(NULL); 


bap = bp->b_addr; 

for(i=0; i<8; I++) { 
*bap++ = ip->i_addr[i]; 
ip->i_addr[i] = 0; 


} 
ip->i_addr[0] = bp->b_blkno; 
bdwrite(bp); 
ip->i_mode =| ILARG; 
goto large; 
} 
nb = ip->i_addr[bn]; 


if(nb == 0 && (bp = alloc(d)) != NULL) { 


bdwrite(bp); 

nb = bp->b_blkno; 
ip->i_addr[bn] = nb; 
ip->i_flag =| IUPD; 


rablock = 0; 
if (bn<7) 

rablock = ip->i_addr[bn+1]; 
return(nb); 


} 
/* 间接 参照 */ 
large: 


i = bn>>8; 
if(bn & 0174000) 
5 
if((nb=ip->i_addr[i]) == 0) { 
ip->i_flag =| IUPD; 
if ((bp = alloc(d)) == NULL) 
return(NULL); 
ip->i_addr[i] = bp->b_blkno; 
} else 
bp = bread(d, nb); 
bap = bp->b_addr; 


/* 双重 间接 参照 */ 
if(i == 7) { 
i = ((bn>>8) & 0377) - 7; 
if((nb=bap[i]) == 0) { 
if((nbp = alloc(d)) == NULL) { 
brelse(bp); 
return(NULL); 


} 
bap[i] = nbp->b_blkno; 
bdwrite(bp); 
} else { 
brelse(bp); 
nbp = bread(d, nb); 


70 bp = nbp; 


71 bap = bp->b_addr; 
72 } 

73 

74 i = bn & 0377; 

75 if((nb=bap[i]) == 0 && (nbp = alloc(d)) != NULL) { 
76 nb = nbp->b_blkno; 
77 bap[i] = nb; 

78 bdwrite(nbp); 

79 bdwrite(bp); 

80 } else 

81 brelse(bp); 

82 rablock = 0; 

83 if(i < 255) 

84 rablock = bap[i+1]; 
85 return(nb); 

86 } 


9~12 ”如 采 参 数 的 逻辑 块 编号 的 值 过 大 ， 则 认为 出 错 。 


15 ”如 采 没 有 设置 jnode[] 元 素 的 ILARG 标志 位 ， 则 按照 直接 
参照 的 方式 进行 处 理 。 


16 ”直接 参照 时 ， 参 数 bn 的 值 应 该 小 于 或 等 于 7 

(inode .i_addr[] 的 元 素数 ) 。 如 果 大 于 7， 则 切换 至 间接 参 
照 方式 。 这 种 情况 只 Re < 件 时 才 会 发 生 ， 即 对 文件 的 
写 入 操作 由 writei() 进行 ， 日 文件 长 度 大 于 4KB。 


17~18 ”执行 alloc() ， 从 存储 区 域 分 配 新 的 块 ， 并 取得 相应 的 
缓冲 区 。 


19~23 将 inode.i addr[] 内 的 数据 复制 到 刚 取 得 的 缓冲 区 ， 
然后 将 inode .i_addr[] 内 的 数据 清 0 。 


24 将 inode.i addr[9] 设置 为 刚 取 得 的 块 的 块 编号 。 


25 ”执行 bdwrite() 对 块 进行 写 入 操作 。inode.i_addr[] 中 
原本 容纳 的 数据 被 输出 。 


26~27 ”设置 inode[] 元 素 的 ILARG 标志 位 ， 然 后 跳 转 至 
large ， 进 行 间接 参照 处 理 。 


29 ”从 此 处 开始 为 一 般 的 直接 参照 处 理 。 首 先 取得 由 参数 指定 的 
逻辑 块 编号 指向 的 inode.i_addr[] 的 值 。 


30~35 ”由 于 文件 长 度 变 大 ， 此 处 需要 取得 新 的 块 。 如 果 从 
inode.i_addr[] 取得 的 值 为 0， 且 通过 alloc( ) 成 功 取 得 新 
的 块 (的 缓冲 区 ) ， 则 将 新 取得 的 块 的 块 编号 注册 到 
inode.i_addr[] ， 并 设置 inode[] 元 素 的 更 新 标志 位 。 


36~38 ”注册 预 污 取 块 编写。 如 来 逻辑 块 编号 小 于 7， 则 注册 与 下 
一 个 逻辑 块 编号 相对 应 的 物理 块 编写。 如 果 是 从 头 开始 按 顺 序 处 
理 文件 内 容 等 情况 ， 则 很 有 可 能 会 立即 对 下 一 个 逻辑 块 进行 处 
理 ， 因 此 ， 此 处 将 其 注册 为 预 处 理 块 。 


39 ”返回 物理 块 编号 。 
42 ”此 处 开始 为 间接 参照 处 理 。 


44~46 ”将 逻辑 块 编号 向 右 移动 8 比特 后 的 值 赋予 i 。 间 接 参 昭 
时，inode .i_addr[] 的 每 个 元 素 对 应 256 个 块 ， 辐 右 移 动 8 比 
特 后 的 值 (= 除 以 256 的 商 ) 相当 于 inode .i_addr[] 的 数组 下 
标 。 如 果 逻 辑 块 编号 的 值 大 于 等 于 0174000 (=2048=256x8) 则 采 
用 双重 间接 参照 ， 此 时 需要 使 用 inode .i_addr[7] ， 因 此 将 i 
的 值 设置 为 7。 


47~54 ”如 果 inode.i_addr[i] 的 值 为 0， 则 设置 ijnode[] 元 
素 的 更 新 标志 位 。 通 过 alloc( ) 从 存储 区 域 取得 新 的 块 (的 缓冲 
区 ) ， 并 将 取得 的 块 的 块 编号 赋予 jnode .i_addr[i] 。 如 果 

inode.i_addr[i] 的 值 不 为 0， 则 通过 bread( ) 读 取 该 块 的 内 


pp 


容 。 
57 ”此 处 开始 到 第 72 行为 双重 间接 参照 处 理 。 


58 ”计算 第 一 级 参照 块 中 相应 的 块 编号 。 从 问 右 移动 8 比特 后 的 
值 中 减 去 7， 表示 从 逻辑 块 编号 中 减 去 1792 (=7x256) 。 通 过 这 


个 计算 可 以 取得 在 双重 间接 参照 (inode .i_addr[7] ) 第 一 级 
参照 块 中 的 偏 移 量 。 


59~65 ”如 果 第 一 级 参照 块 中 相应 元 素 的 块 编 号 为 0 时， 通过 
alloc( ) 从 存储 区 域 取得 新 的 块 (的 缓冲 区 ) ， 并 将 取得 的 块 的 
块 编号 分 配给 相应 元 素 ， 然 后 执行 bdwrite() ， 对 块 设备 进行 
延迟 写 入 。 


66~69 ”相应 元 素 持 有 0 以 外 的 块 编 呈 时， 执行 bread( ) 读 取 该 
块 的 内 容 。 


70~71 “用 取得 的 块 设备 缓 神 区 更 新 变量 bp 和 bap 。 对 第 二 级 参 
照 块 的 遍历 处 理由 此 后 一 般 的 间接 参照 处 理 进行 。 


74 ”此 处 开始 为 一 般 间 接 参 照 块 的 读 取 人 处理 。i 被 设 定 为 逻辑 块 
编号 的 低位 比特 ， 相 当 于 间接 参照 块 中 的 偏 移 量 。 


75~81 ”由 间接 参照 块 中 的 偏 移 量 取 得 块 编 号 。 如 果 为 0， 则 竹 试 
通过 alloc( ) 从 存储 区 域 取 得 新 的 块 。 将 取得 的 块 的 块 编 号 分 配 
给 偏 移 量 ， 然 后 执行 bdwrite( ) 对 取得 的 块 和 间接 参照 块 进行 
延迟 写 入 。 如 末 块 编号 不 为 0 则 释放 间接 参照 块 。 


2 将 预 读 取 块 编号 设 定 为 与 下 一 个 逻辑 块 编号 相对 应 的 物理 
编写。 


85 ”返回 物理 块 编号 。 


itrunc() 


itrunc() 将 参数 inode[] 元 系 使 用 的 存储 区 域 的 块 编号 返还 给 空 闪 
队列 ( 表 9-14， 代 码 清单 9-16 ) ， 然 后 将 文件 长 度 和 


inode.i_addr[] 全 部 清 0。 


间接 参照 时 ， 将 相应 的 间接 块 也 一 并 返还 到 空 内 队列 。 文 件数 据 本 里 
仍 傈 存在 块 设备 的 存储 区 域 中 ， 直 到 该 区 域 被 别 的 数据 履 兰 。 


表 9-14 itrunc() 的 参数 


代码 清单 9-16 itrunc() (ken/iget.c) 


1 itrunc(ip) 
2 int *ip; 


3 { 


register *rp, *bp, *cp; 
int *dp, *ep; 


rp = ip; 
if((rp->i_mode&(IFCHR&IFBLK)) != 0) 
return; 
for(ip = &rp->i_addr[7]; ip >= &rp->i_addr[0]; ip--) 
if(*ip) { 
if((rp->i mode&ILARG) != 0) { 
bp = bread(rp->i dev, *ip); 
for(cp = bp->b_addr+512; cp >= bp->b_addr; cp--) 
if(*cp) { 
if(ip == &rp->i_addr[7]) { 
dp = bread(rp->i_dev, *cp); 
for(ep = dp->b_addr+512; ep >= dp->b_addr; 


if(*ep) 
free(rp->i_ dev, *ep); 
brelse(dp); 
} 


free(rp->i_ dev, *cp); 


} 
brelse(bp); 


} 
free(rp->i_ dev, *ip); 
*ip = 0; 
} 
rp->i_mode =& ~ILARG; 
rp->i_size0 = 0; 
rp->i_sizel1 = 
rp->i_flag =| 


8~9 ”如果 是 特殊 文件 ， 则 不 做 任何 处 理 立 即 返 回 。 

10~11 遍历 inode.i addr[]。 

12 ”如 果 设 置 了 ILARG 标志 位 ， 则 遍历 间接 参照 块 。 

13 ” 读 取 与 jnode.i_addr[] 元 素 指 向 的 块 编号 相对 应 的 块 。 


14~26 ”参照 块 容纳 着 块 编号 的 队列 。 从 后 疝 前 人 志 历 队列 ， 通 过 执 
行 free( ) ， 每 次 部 返还 一 个 块 编 号 给 空间 队列 。 因 为 
inode.i_addr[7] 供 双 重 间接 参照 使 用 ， 首 先 读 取 各 块 编号 所 
J 再 通过 free( ) 将 其 中 保存 的 块 编号 队列 返还 给 空间 
队列 。 


27~28 ”执行 free()， 将 inode.i addrfr] 元 素 指 向 的 块 编号 
返还 给 空闲 队列 ， 并 将 inode .i_addr[] 元 素 的 值 置 为 0。 


30~33 ” 重 轩 inode[] 元 素 的 ILARG 标志 位 ， 将 文件 长 度 设 为 
0， 并 设置 更 新 标志 位 。 


9.6 分配 块 设 备 中 的 块 


块 设备 中 的 ipode 和 存储 区 域 中 的 块 ， 分 别 由 超级 块 中 的 inode 空闲 队 
列 (filsys. s_inode[] ) 和 存储 空闲 队列 (filsys.s_free[] 
) 管理 。filsys.s_inode[] 和 filsys.s_free[] 的 元 素数 为 
100， 分 别 保存 着 未 分 配 的 inode 编号 和 未 分 配 的 存储 区 域 的 块 编号 。 
而 filsys.s_ninode 和 filsys.s_nfree 分 别 容纳 inode 空闲 队 
列 和 存储 空 帮 队列 中 编号 的 数量 。 这 两 个 变量 的 值 变 为 0 时 ， 需 要 从 
块 设备 取得 未 分 配 的 inode 编号 和 块 编号 补充 空 闪 队列 。 


ialloc() 


ialloc( ) 用 来 分 配 块 设备 中 inode 区 域 的 未 分 配 inode ( 表 9-15， 代 
码 清单 9-17 ) 。 首 先 取 得 由 filsys,s_ninode 指向 的 
filsys.s_inode[] 元 素 ， 然 后 通过 inode 编号 取得 inodef[] 元 
素 ， 同 时 递减 fijlsys.s_ninode 。 将 filsys.s_inode[] 看 做 存 


放 未 使 用 inode 编号 的 栈 , 将 filsys,s_ninode 看 做 栈 指针 ， 可 能 
更 容易 理解 (图 9-10) 。 


filsys.s_inode[] 为 空 时 ， 从 块 设备 的 inode 区 域 的 头 部 ( 块 编号 
2 ) 开始 按 顺 序 检 查 inode， 将 未 使 用 的 inode 编号 追加 至 
filsys.s_inode[] (图 9-11) 。 


由 于 当 filsys,s_inodef[] 为 空 时 才 需 要 访问 块 设备 ， 这 与 每 当 收 
"1 inode 的 请 求 时 则 立即 访问 块 设备 的 做 法 相 比 ， 在 性 能 
具有 优势 。 


执行 iget() 并 返回 
inode[] 元 素 


! 


志 -一 filsys.s_ninode 


0 


filsys.s_inodel] 的 
数组 下 标 


filsys.s_inodel] 


图 9-10 ialloc0 


内 存 


块 设备 


inode 区 域 


filsys.s_inodel] 


图 9-11 对 inode 空闲 队列 进行 补 } 
表 9-15 ialloc0 的 参数 


代码 清单 9-17 ialloc() (ken/alloc.aO 


alloc(dev) 


i 


register *fp, *bp, *ip; 
int i, j, k, ino; 


fp = getfs(dev); 
while(fp->s_ilock) 
sleep(&fp->s_ilock, PINOD); 
loop: 
if(fp->s_ninode > 0) { 
ino = fp->s_inode[--fp->s_ninodel]; 


POVONOORRODP 


上 户 


12 ip = iget(dev, ino); 


13 if (ip==NULL) 

14 return(NULL); 

15 if(ip->i_mode == 0) { 

16 for(bp = &ip->i_ mode; bp < &ip->i_addr[8];) 
17 *bp++ = 0; 

18 fp->s_fmod = 1; 

19 return(ip); 

20 

21 iput(ip); 

22 goto loop; 

23 

24 fp->s_ilock++; 

25 ino = 0; 

26 for(i=0; i<fp->s_isize; i++) { 
27 bp = bread(dev, i+2); 

28 ip = bp->b_addr; 

29 for(j=0; j<256; j=+16) { 

30 Ino++， 

31 if(ip[j] != 0) 

32 continue; 

33 for(k=0; k<NINODE; k++) 
34 if(dev==inode[k].i dev && ino==inode[k].i_number) 
35 goto cont; 

36 fp->s_inode[fp->s_ninode++] = ino; 
37 if(fp->s_ninode >= 100) 
38 break; 

39 cont:; 

40 } 

41 brelse(bp); 

42 if(fp->s_ninode >= 100) 

43 break; 

44 } 

45 fp->s_ilock = 0; 

46 wakeup(&fp->s_ilock); 

47 if (fp->s_ninode > 0) 

48 goto loop; 

49 prdev("Out of inodes", dev); 

50 U.U_error = ENOSPC,; 

51 return(NULL); 

52 } 


6 ”取得 与 参数 的 设备 编号 相对 应 的 filsys 结构 体 (超级 块 ) 。 
7~8 ”进入 睡眠 状态 直至 解锁 filsys 结构 体 。 


10 ” 当 inode 空 几 队列 中 还 存在 未 分配 的 inode 编号 时 的 处 理 。 
11 ”取得 位 于 inode 空闲 队列 ( 栈 ) 头 部 的 inode 编号 。 


12~14 ”利用 所 取得 的 inode 编号 调用 ijget( ) 以 取得 ijnode[] 
元 素 。 

15 ”取得 的 inode[] 元 素 的 i_mode 为 0 时 的 处 理 (释放 inode 
时 相应 的 inode[] 元 素 的 i_mode 被 清 0， 如 果 i mode 不 为 0 
则 说 明 该 ijnode[] 元 素 仍 处 于 使 用 中 的 状态 ， 或 者 inode 的 释放 
处 理 未 能 正常 执行 ) 。 

16~17 将 inode[] 元 素 从 i_mode 至 i_addr 的 部 分 清 0。 


18 将 filsys.s_fmod 置 1 以 设置 filsys 结构 体 的 更 新 标志 
位 。 


19 ”返回 ijnode[] 元 素 。 


21~22 ”如 果 inode.i mode 的 值 不 为 0， 则 释放 取得 的 
inodef[] 元 素 ， 然 后 返回 loop 处 ， 并 再 次 党 试 取得 inode 。 


24 ”如 果 空 帮 队 列 内 不 存在 尚未 分 配 的 inode 编号 ， 则 取得 
filsys 结构 体 的 锁 。 


26 “遍历 块 设备 的 inode 的 块 (#2~) 。 
29 ”遍历 块 中 所 有 的 inode。 


31~32 ”如 果 inode.i_mode 不 为 0， 则 表示 该 inode 处 于 使 用 
中 的 状态 ,执行 continue 。 

33~35 ”如 果 inode[] 中 存在 相应 元 素 则 跳 转 至 cont 。 似 乎 是 
在 块 设备 和 内 存 中 都 确认 了 该 inode 未 被 分 配 ， 所 以 才 将 其 视 作 未 
分 配 inode。 

36 “将 inode 编号 奶 加 至 空闲 队列 。 


37~38 ”如果 空 采 队列 已 满 ， 则 执行 break 退出 循环 。 


42~43 ”如 果 空 帮 队 列 已 满 ， 则 执行 break 退出 循环 ， 终 止 补充 
空 内 队列 的 处 理 。 


45 ”释放 filsys 结构 体 的 锁 。 
46 ”唤醒 正在 等 待 解锁 filsys 结构 体 的 进程 。 


47~48 ”如 末 同 空 几 队列 至 少 补 充 一 个 未 分 配 的 inode 编号 ， 则 返 
回 1oop 执行 分 配 inode 的 处 理 。 


ifree() 


ifree() 用 于 释放 inode ( 表 9-16， 代 码 清单 9-18 ) 。 将 被 释放 的 
inode 的 inode 编号 奶 加 至 空 闻 队列 。 如 果 空 有 队列 已 满 ， 则 丢弃 inode 
编号 (图 9-12 ) 。 于 弃 的 inode 编号 在 通过 ijalloc( ) 补充 空间 队列 
时 被 回收 。 


如 果 空 闲 队 列 
存在 空间 


<— filsys.s_ninode 
inode 编号 
一 一 一 一 


flsys.s_inodel] 


<— filsys.s_ninode(100) 
空闲 队列 已 满 时 


inode 编号 


即使 此 时 未 被 追加 至 空闲 
队列 ， 在 执行 ialloc() 补充 
空闲 队列 时 也 会 被 回收 


filsys.s_inodel] 


图 9-12 ifree() 
表 9-16 ifree() 的 参数 


free(dev, ino) 


i 
C 


register *fp; 


fp = getfs(dev); 
if(fp->s_ilock) 

return; 
if(fp->s_ninode >= 100) 

return; 
fp->s_inode[fp->s_ninode++] = ino; 
fp->s_fmod = 1; 


5 ”取得 与 参数 指定 的 设备 编写 相对 应 的 filsys 结构 体 。 

6~7 ”如 有 果 filsys 结构 体 被 加 锁 ， 则 不 做 任何 处 理 立 即 返 回 。 尽 
管 此 时 未 能 将 当前 的 inode 编号 回收 至 空 内 队列 ， 但 在 通过 
ialloc( ) 补充 空 几 队列 时 ， 一 定 会 进行 回收 。 


8~9 ”当空 用 队列 已 满 时 ， 不 做 任何 处 理 立 即 返 回 。 出 于 与 上 述 同 
样 的 原因 ， 此 处 也 不 存在 回收 的 问题 。 


10 ”将 inode 编号 返回 至 空间 队列 。 


11 设置 filsys 结构 体 的 更 新 标志 位 。 
alloc() 


alloc( ) 是 分 配 块 设备 存储 区 域 中 未 使 用 的 块 的 函数 ( 表 9-17， 代 码 
清单 9-19 ) 。 首 先 取得 filesys.s_nfree 指向 的 
filsys.s_free[] 元 素 ， 然 后 使 用 该 块 编号 取得 块 设备 的 缓冲 区 。 


如 琳 空 内 队列 已 空 ， 则 从 块 设备 存储 区 域 取得 未 使 用 的 块 编写， 将 其 
补充 至 空 几 队列 。 此 处 的 补充 处 理 与 针对 inode 的 补充 处 理 有 很 大 不 
同 。 块 设备 中 的 每 99 个 未 使 用 的 块 编号 用 1 个 队列 管理 ， 队 列 尖 部 的 
元 素 保 存 着 队列 中 的 元 素数 和 下 一 个 队列 的 块 编号 (图 9-13 ) 。 这 个 
未 使 用 块 编号 的 队列 在 执行 /etc/mkfs 时 生成 ， 通 过 复制 该 队列 补 
充 存储 空间 队列 (图 9-14) 。 


存储 区 域 


图 9-13 未 使 用 块 编号 的 队列 


存储 区 域 


和 
| 块 编号 
| 块 编号 | 


/ 
/ 
/ 
/ 
/ 


1 
1 
1 
1 
i L ”100[ ” 块 编 号 
1 
1 
1 


图 9-14 补 } 存 储 空 闪 队列 
表 9-17 alloc0 的 参数 


lloc(dev) 


[tn Ee) 


int bno; 
register *bp, *ip, *fp; 


while(fp->s_flock) 
sleep(&fp->s_flock, PINOD); 
do 区 
if(fp->s_nfree <= 0) 


1 
2 
3 
4 
5 
6 fp = getfs(dev); 
7 
8 
9 
0 
1 goto nospace; 


12 bno = fp->s_free[--fp->s_nfreel]; 


13 if(bno == 0) 

14 goto nospace; 

15 } while (badblock(fp, bno, dev)); 
16 if(fp->s_nfree <= 0) { 
17 fp->s_flock++; 

18 bp = bread(dev, bno); 
19 ip = bp->b_addr; 

20 fp->s_nfree = *ip++; 
21 bcopy(ip, fp->s_free, 100); 
22 brelse(bp); 

23 fp->s_flock = 0; 

24 wakeup(&fp->s_flock); 
25 } 

26 bp = getblk(dev, bno); 

27 clrbuf(bp); 

28 fp->s_fmod = 1; 

29 return(bp); 

30 

31 nospace: 

32 fp->s_nfree = 0; 

33 prdev("no space", dev); 
34 U.U_error = ENOSPC,; 

35 return(NULL); 

36 } 


6 ”取得 与 参数 指定 的 设备 编号 相对 应 的 filsys 结构 体 。 


7~8 ”如 果 filsys 结构 体 被 加 锁 ， 则 进入 睡眠 状态 直至 解锁 。 

9 ”进行 循环 直至 取得 合适 的 块 编 号 。 如 果 取 得 的 块 编号 既 未 指 问 
块 设备 的 inode 区 域 ， 也 未 指向 存储 区 域 badblock( ) 将 返回 
1 O 

10~11 ”如 果 空 用 队列 为 空 则 跳 转 至 nospace 。 

12~14 ”从 空 几 队列 取得 块 编 和 号。 如果 为 0 则 跳 转 至 nospace 。 


16 ”如 琳 取 得 了 合适 的 块 编号 ， 且 空 内 队列 变 为 空 时 ， 对 其 进行 
补充 处 理 。 


17 对 filsys 结构 体 加 锁 。 


18 ”取得 的 块 编号 指向 容纳 着 下 一 个 未 使 用 块 编号 队列 的 块 ， 执 
行 bread( ) 读 取 该 块 。 


20 在读 取 的 块 的 头 部 容纳 着 该 队列 中 块 编号 的 数量 ， 将 其 复制 
到 filsys,s_nfree 。 


21 执行 bcopy() ， 将 队列 整体 拷贝 到 filsys.s_free 。 
22 ”释放 缓冲 区 。 

23 ”将 filsys 结构 体 解锁 。 

24 ”唤醒 正在 等 待 解锁 filsys 结构 体 的 进程 。 

26 ”利用 取得 的 块 编号 ,执行 getblk() ， 取 得 对 应 的 缓冲 区 。 
27 ”将 取得 的 缓冲 区 清 0。 

28 ”设置 filsys 结构 体 的 更 新 标志 位 。 


“这 里 的 原文 有 误 。 只 有 当 块 编号 未 指向 存储 区 域 时 ，badb1lock( ) 才 返回 1。 一 一 译 者 注 


free() 


free( ) 用 于 释放 存储 区 域 的 块 ( 表 9-18， 代 码 清 单 9-20 ) ， 并 将 块 
编号 追加 至 空 队 列 。 当 空 内 队列 已 满 时 ， 将 空 几 队列 的 内 容 写 入 准 
备 释 放 的 块 。 写 入 的 内 容 为 ， 以 当前 的 filsys.s_nfree 为 起 始 元 
素 ， 其 后 跟随 filsys.s_free[] 元 素 。 随 后 将 filsys,s_nfree 
清 。 并 将 filsys.s_free[0] 设 定 为 准备 释放 的 块 的 块 编号 (图 
9-15) 。 


内 存 块 设备 存储 区 域 


filsys.s_freel] 


< 一 准备 释放 的 块 


和 
一 


存储 区 域 


MI A 
1 | 块 编号 < 一 准备 释放 的 块 
2 | 块 编号 


图 9-15 free() 
表 9-18 free() 的 参数 


代码 清单 9-20 free0) (ken/alloc.c) 


free(dev, bno) 
{ 
register *fp, *bp, *ip; 
fp = getfs(dev); 
fp->s_fmod = 1; 
while(fp->s_flock) 
sleep(&fp->s_flock, PINOD); 
if (badblock(fp, bno, dev)) 
return; 
if(fp->s_nfree <= 0) { 
fp->s_nfree = 1; 
fp->s_free[0] = 09; 


OOOOORRODP 


} 

if(fp->s_nfree >= 100) { 
fp->s_flock++; 
bp = getblk(dev, bno); 
ip = bp->b_addr; 
*ip++ = fp->s_nfree; 
bcopy(fp->s_free, ip, 100); 
fp->s_nfree = 0; 
bwrite(bp); 
fp->s_flock = 0; 
wakeup(&fp->s_flock); 


fp->s_free[fp->s_nfree++] = bno; 
fp->s_fmod = 1; 


5 ”取得 与 参数 指定 的 设备 编号 相对 应 的 filsys 结构 体 。 


6 设置 filsys 结构 体 的 更 狐 标 志 位 。 
7~8 ”进入 睡眠 状态 直至 解锁 filsys 结构 体 。 
9~10 “如 有 果 参 数 的 块 编号 的 值 有 误 则 返回 。 


11~14 ”如 果 filsys.s_nfree 的 值 小 于 等 于 0， 则 将 其 设 为 
1， 并 将 filsys,s_free[9] 设 为 0。 


人 空 内 队列 已 满 ， 则 将 空 几 队列 写 入 块 设备 ， 并 重 荀 空 朵 


16 ”将 filsys 结构 体 加 锁 。 

17 ”取得 与 参数 的 块 编号 相对 应 的 缓冲 区 。 

19 将 filsys.s_nfree 保存 至 缓冲 区 的 起 始 位 置 。 

20 ”将 空间 队 列 整体 复制 到 缓冲 区 。 

21 将 filsys.s_nfree 设 定 为 0 (将 空间 队列 清空 ) 。 
22 ”将 保存 空间 队列 的 缓冲 区 写 入 块 设备 。 

23 ”将 filsys 结构 体 解锁 。 

24 ”唤醒 正在 等 待 解 锁 filsys 结构 体 被 进程 。 


问 空 闲 队 列 追 加 块 编 号 。 如 果 第 15 行 的 值 为 真 ， 空 内 队列 的 
头 部 将 被 设 定 为 下 一 个 队列 的 块 编号 。 


27 ”设置 filsys 结构 体 的 更 新 标志 位 。 


getfs() 


getfs() 用 来 取得 与 设备 编号 相对 应 的 filsys 结构 体 (超级 块 ) 
( 表 9-19， 代 码 清单 9-21 ) 。 该 画 数 在 mount[] 中 寻找 与 参数 指定 
的 设备 编号 相对 应 的 元 素 。 


表 9-19 ”getfs( 的 参数 


etfs(dev) 


register struct mount *p; 
register char *n1i、 *n2; 


for(p = &mount[0]; p < &mount[NMOUNT]; p++) 
if(p->m bufp != NULL && p->m dev == dev) { 
p = p->m_bufp->b_addr; 
n1 = p->s_nfree; 
n2 = p->s_ninode; 
if(n1 > 100 || n2 > 100) { 
prdev("bad count", dev); 
p->s_nfree = 0; 
p->s_ninode = 0; 


return(p); 


panic("no fs"); 


9~15 如果 filsys.s_nfree 或 filsys.n_ninode 的 值 大 于 
100， 可 认为 是 错误 值 ， 此 时 返回 0。 


badblock() 
badblock( ) 用 于 检查 块 编号 是 否 合适 ( 表 9-20， 代 码 清单 9-22 ) 。 


人 
1 。 


5 这 里 的 原文 有 误 。 只 有 当 块 编号 指向 存储 区 域 时 badblock( ) 才 返 
一 译 者 注 


表 9-20 ”badblock() 的 参数 


构 体 ) 


adblock(afp, abn, dev) 


b 


register Struct filsys *fp; 
register char *bn; 


afp; 
= abn; 
If (bn < fp->s_isize+2 || bn >= fp->s_fsize) { 
prdev("bad block", dev); 
return(1); 


return(0); 


9.7 ”将 路 径 变 为 inode 
目录 的 内 容 


| 
(ew) 


文件 和 目录 可 通过 路 径 访问 。 目 孙 拥 有 文件 名 和 inode 编号 的 对 应 表 。 
该 表 中 一 条 记录 的 长 度 为 16 字 节 ， 头 部 的 2 字 节 是 与 文件 相对 应 的 
inode 编号 ， 其 后 的 14 字 节 为 文件 或 目录 名 ( 表 9-21 ) 。 请 注意 文件 
或 inode 本 身 并 没有 文件 名 。 


表 9-21 目录 内 容 例 


inode 编号 (2 字 节 ) 文件 或 目录 名 (14 字 节 ) 
ee 


以 根 目录 或 当前 目录 为 起 氮 ， 由 路 径 的 起 始 位 置 开始 逐个 取得 与 路 径 
的 各 个 要 又 相对 应 的 inode[] 元 隶 。 如 果 元 系 为 目 永 ， 则 取得 与 该 目 
杂 相 对 应 的 inode[] ， 然 后 再 重复 上 述 处 理 ， 这 样 束 可 以 取得 与 目标 
文件 或 目录 相对 应 的 全 部 ijnode[] (图 9-16) 。 


0x11 /dir1/dir2/file 


oo test |- 
: iget() 口 文件 
0 
0x22 
Ox00| hoge | 


目录 中 的 “.” 和 “..” 
元 素 未 显示 在 图 中 


图 9-16 遍历 文件 路 径 
namei() 


namei( ) 遍历 文件 路 径 ， 取 得 与 文件 路 径 名 相对 应 的 文件 或 目录 的 
inode[] 元 素 ( 表 9-22， 代 码 清单 9-24) 。 


如 果 给 出 的 路 径 名 的 起 始 字符 为 少 ， 可 判断 该 路 径 为 绝对 路 径 ， 并 将 
根 目录 作为 遍历 的 起 点 。 否 则 可 判断 为 相对 路 径 ， 并 将 当前 路 径 作 为 
所 历 的 起 点 。 


从 路 径 名 的 起 始 位 置 开 始 逐 个 取得 构成 路 径 的 各 个 元 素 ， 然 后 遍历 各 
个 目录 对 应 表 所 包含 的 记录 ， 再 使 用 iget( ) 取得 与 各 记录 相对 应 的 
inode[] 元 素 ， 并 重复 上 述 处 理 。 


遍历 目录 的 同时 检查 路 径 是 否 恰当 和 访问 权限 。 如 果 对 某 个 目录 不 具 
备 执行 权限 ， 是 无 法 访问 该 目 孙 中 的 数据 的 。 
namei( ) 的 参数 中 的 flag 代表 准备 对 路 径 表 示 的 文件 进行 的 操作 ， 
可 指定 的 操作 包括 寻找 、 生 成 或 是 删除 。 根 据 指 定 的 操作 ， 会 相应 的 
更 新 User 结构 体 的 内 容 。 
。U.Uu_pdir : 只 有 当 准 备 生 成 新 的 文件 或 目 孙 时 ， 才 会 设 定 为 与 
对 象 文 件 的 父 目 录 相 对 应 的 inode[] 元 素 。 如果 准 备 生成 名 


为 “/home/hoge/fuga” 的 文件 ， 则 将 u,u_pdir 设 定 为 
与 “/home/hoge” 相 对 应 的 Inode[] 元 于 


。U.U_offset : 只 有 当 准 备 生 成 新 的 文件 或 目录 时 ， 才 会 设 定 为 
指向 对 象 文件 父 目录 中空 记录 的 偏 移 量 


。U.Uu_dbuf : 文件 名 或 目录 名 。 如 果 路 人 径 名 为 “/home/hoge/fuga”， 
则 将 u,u_ dbuf 设 定 为 “fuga” 


很 多 函数 都 是 使 用 上 述 更 新 后 的 数据 进行 自身 处 理 的 ， 因 此 在 执行 这 
些 芳 数 之 前 ， 需 要 首先 执行 namei()。 


namei( ) 通过 执行 schar() 和 uchar() 取得 路 径 名 (代码 清单 9- 
23 ) 。schar() 和 uchar() 的 区 别 在 于 路 径 名 是 保存 在 用 户 空间 还 


是 内 核 空间 。 


一 般 来 说 ， 用 户 程序 通过 系统 调用 对 文件 进行 操作 。 此 时 在 trap() 
中 ,将 u,u_dirp 设 定 为 u.u_arg[0] 。u.u_arg[0] 是 赋予 系统 
调用 的 参数 ， 被 设 定 为 路 径 名 的 地 址 。uchar ( ) 通过 一 边 对 
uU.U_dirp 进行 位 移 操 作 ， 一 边 执行 fubyte( ) ， 在 用 户 空 间 逐 个 处 
理 构 成 数据 的 字符 。 


当 内 核 程序 希望 独 目 操作 文件 时 ， 也 采取 将 u,u_dirp 设 定 为 路 径 名 
地 址 的 方式 。 此 时 不 会 发 生 模 式 的 切换 ， 而 是 通过 逮 增 u.u_dirp 对 
人 二 站 


代码 清单 9-23 ”schar( 和 uchar() 


1 schar() 

2 return(*u.u_dirp++ & 0377); 
3 

4 

5 uchar() 

6 

7 register c; 

8 

9 c = fubyte(u.u_dirp++); 
10 if(c == -1) 
11 U.Uu_error = EFAULT,; 


12 return(c); 


13 } 


表 9-22 namei( 的 参数 


func | &uchar 或 &schar 。 于 路 径 名 是 存在 于 用 户 空 间 还 是 内 核 空间 


数 


0 : 寻找 路 径 名 所 示 的 inode。1 : 生成 路 径 名 所 示 的 inode。2 : 删除 路 径 名 


站 39 | 所 示 的 inode 


1 namei(func, flag) 

2 int (*func)(); 

3 { 

4 register struct inode *dp; 
5 register c; 

6 register char *cp; 

7 int eo, *bp; 

8 

9 dp = u.u_cdir; 
10 if((c=(*func)()) == '/') 
11 dp = rootdir; 
12 iget(dp->i_dev, dp->i_number); 
13 while(c == '/') 
14 c= (*func)(); 
15 if(c == '\0' && flag != 0) { 
16 U.Uu_error = ENOENT,; 
17 goto out; 
18 } 
19 
20 cloop: 
21 if(u.u_error) 
22 goto out; 
23 if(c == '\0') 
24 return(dp); 


eloop: 


if((dp->i mode&IFMT) != IFDIR) { 
Uu.Uu_error = ENOTDIR; 
goto out; 
} 
if(access(dp, IEXEC)) 
goto out; 
cp = &u.u_dbuf[0]; 
while(c!='/' && c!='\0' && U.U_ error==0) { 
if(cp < &u.u_dbuf [DIRSIZ]) 
*Cp++ = C; 
c = (func)(); 
} 
while(cp < &u.u_dbuf[DIRSIZ]) 
*Cp++ = '\QO'; 
while(c == '/') 
c= (*func)(); 
if(u.u_error) 
goto out; 
u.u_offset[1] = 909; 
u.u_offset[0] = 909; 
u.u_segflg = 1; 
eo = 0; 
U.u_count = ldiv(dp->i_ sizel1, DIRSIZ+2); 
bp = NULL; 
if(u.u_count == 0) { 
if(bp != NULL) 
brelse(bp); 
if(flag==1 && c=='\0') { 
if(access(dp, IWRITE)) 
goto out; 
u.u_pdir = dp; 
if(eo) 
u.u_offset[1] = e0-DIRSIZ-2; else 
dp->i_flag =| IUPD; 
return(NULL); 
} 
Uu.Uu_error = ENOENT; 
goto out; 
} 
if((u.u_offset[1]&0777) == 0) { 
if(bp != NULL) 
brelse(bp); 
bp = bread(dp->i_deyv, 
bmap(dp, ldiv(u.u_offset[1], 512))); 
} 


77 


78 bcopy(bp->b_addr+(u.u_offset[1]&0777), &u.u_dent, 
(DIRSIZ+2)/2); 

79 u.u_offset[1] =+ DIRSIZ+2 ， 

80 U.U_count--; 

81 if(u.u_dent.u_ino == 0) { 

82 if(eo == 0) 

83 eo = Uu.u_offset[1]; 

84 goto eloop; 

85 } 

86 for(cp = &u.u_dbuf[0]; cp < &u.u_dbuf[DIRSIZ]; cp++) 
87 if(*cp != cp[u.u_dent.u _ name - u.u_dbuf]) 
88 goto eloop; 

89 

90 if(bp != NULL) 

91 brelse(bp); 

92 if(flag==2 && c=='\0') { 

93 if(access(dp, IWRITE)) 

94 goto out; 

95 return(dp); 

96 } 

97 bp = dp->i_dev; 

98 iput(dp); 

99 dp = iget(bp, u.u_dent.u_ino); 
100 if(dp == NULL) 
101 return(NULL); 
102 goto cloop; 
103 
104 out: 
105 iput(dp); 
106 return(NULL); 
107 } 


9~11 rootdir 表示 与 根 目录 相对 应 的 inode[] 元 素 ， 在 系统 
启动 时 设 定 (代码 清单 9-25) 。 如 果 路 径 名 以 ‘开始 ， 则 将 dp 设 
定 为 与 根 目录 相对 应 的 ijnode[] 元 素 ， 否 则 将 其 设 定 为 
u.u_cdir (当前 目录 ) 。dp 将 作为 遍历 的 起 点 。 


代码 清单 9-25 rootdir (system.h) 


1 nt *rootdir; 


12 ”执行 jget() 并 等 待 解锁 inode[] 元 素 ， 然 后 确认 相关 的 
文件 系统 已 被 挂 载 ， 递 增 参照 计数 器 ， 再 对 inodef[ ] 元 素 加 锁 。 


13~14 “如果 路 径 名 中 的 指针 指向 % 则 忽略 该 字符 ， 移 动 指针 使 其 
指向 ‘的 下 一 个 字符 ， 并 将 该 字符 赋予 c。 结 束 循环 时 ， 如 末路 
径 名 为 “////home/fuga” 则 c 的 值 为 h”。 如 果 路 径 名 为 “foo/var” 则 c 
的 值 为 f*。 


15~18 ” 当 路 径 名 为 % ( 空 字 符 ) 、42" 或 /时 ， 此 处 if 语句 中 的 
c == ‘\0' 的 值 为 真 。 根 目录 是 无 法 生成 或 删除 的 。 


20 ”以 cloop 为 起 点 的 代码 从 u.u_dirp 指向 的 元 素 中 取出 一 
个 元 素 ， 之 后 将 对 其 进行 各 种 处 理 。 此 时 dp 指向 与 最 后 处 理 的 要 
素 相对 应 的 inode[] 元 素 。 


21~22 ”如 果 发 生 错 误 则 跳 转 至 out 。u.u_error 中 可 能 容纳 由 
iget() 等 生成 的 错误 代码 。 


23~24 ”如 果 已 到 路 径 名 的 末尾 ， 则 返回 dp 。 假 设 路 径 名 
为 “home/hoge/fuga” 时 ， 此 处 dp 的 值 为 与 “fuga” 对 应 的 jnode[] 
条 9 


26~29 ”如果 dp 不 为 目录 则 进行 错误 处 理 。 假 设 路 径 名 
为 “/home/hoge/fuga” 时 ， 如 有 果 “hoge”* 不 为 目录 将 引发 错误 。 


30~31 ”如 果 对 dp 不 具备 执行 权限 则 进行 错误 处 理 。 假 设 路 径 名 
为 “home/hoge/fuga” 时 ， 如 果 对 目录 “hoge” 不 具备 执行 权限 将 引发 


错误 。 


33~40 ”u.u_dbuf 容纳 着 dp 指向 的 元 素 的 下 一 个 元 素 名 。 假 设 
路 径 名 为 “homehoge/fuga”， 且 dp 指 辣 与 “home” 相 对 应 的 
inode[] 元 泰 时 ，u.u_dbuf 的 值 为 “hoge”。 由 于 u.u_dbuf 只 
能 容纳 DIRSIZ (=14。 代 码 清 单 9-26) 个 字符 ， 之 后 的 字符 将 被 
忽略 。 如 果 不 到 14 个 字符 ， 那 么 剩余 的 字符 将 用 NULL (0) 填 


代码 清单 9-26 DIRSIZ (param.h) 


1 #define DIRSIZ 14 


41~42 ”忽略 重复 的 /字符 。 


43~44 “如 果 设 定 了 u,u_error ， 则 进行 错误 处 理 。 
u.u_error 中 可 能 容纳 由 uchar( ) 等 生成 的 错误 代码 。 


假设 路 径 名 为 “/home/hoge/fuga”， 且 dp 指 疝 与 “home” 相 对 应 的 
inode[] 元 素 时 ， 此 时 u.u_dbuf 的 值 为 “hoge\Q\0\0...”， 而 
u.u_dirp 指向 “fuga” 头 部 的 。 


46~51 ”由 于 dp 指向 与 目 孙 相对 应 的 jnode[] 元 素 ， 此 后 将 从 
dp 代表 的 目录 的 对 应 表 中 寻找 与 u,u_dbuf 容纳 的 元 素 名 相对 应 
的 记录 ， 因 此 在 此 处 首先 进行 初始 化 设 定 。u.u_count 表示 目 孙 
对 应 表 中 的 记录 数 。 因 为 目录 的 文件 长 度 等 于 记录 数 x16 ( 字 

节 ) ， 所 以 将 文件 长 度 除 以 16 (DIRSIZ +2) 即 可 得 到 记录 数 。 


53 ”此 后 为 检查 目录 对 应 表 中 一 条 记录 的 处 理 。 


55 ” 当 检 查 完 所 有 记录 也 未 找到 与 u.,u_dbuf 容纳 的 元 素 名 相对 
Pi 。 每 处 理 一 条 记录 后 将 递 诚 U.u_count (第 
80 行 ) 。 


56~57 ”如果 bp 有 块 设备 缓冲 区 ， 则 释放 该 缓冲 区 。 第 74 行 的 
bp 有 可 能 个 赋 予 块 设备 绥 冲 区 。 


58 ”如 果 flag 为 1 (试图 生成 文件 或 目录 时 ) ， 且 u.u_dirp 
指向 路 径 末 尾 时 的 处 理 。 假 设 路 径 名 为 "home/hoge/fuga”， 且 dp 
指向 与 hoge 相对 应 的 inode[] 元 素 。u,u_dbuf 的 值 

为 “fuga\0\0...”， 而 U.Uu_dirp 指 癌 路 径 末 尾 (“fuga” 之 后 ) 。 此 
| I 在 目录 “/home/hoge” 中 生成 名 为 “fuga” 的 文件 或 


59~60 ”如 果 dp (与 目录 相对 应 的 ijnode[] 元 素 ， 在 此 目录 中 
试图 生成 新 的 文件 或 目录 ) 不 具备 写 入 权限 将 引发 错误 。 


61 将 u,updir 设 定 为 dp ， 此 处 的 u,u_pdir 将 使 用 在 别 的 
函数 中 。 


62~64 ”如 采 eo 的 值 不 为 0， 则 将 u.u_offset[1] 设 为 由 eo 
减 去 16 ( 字 节 ) 后 的 值 。 因 为 eo 指向 位 于 dp 代表 的 目录 对 应 表 
中 衬 记 录 之 后 的 记录 ， 减 去 16 (一 条 记录 的 长 度 ) 后 将 指向 空 记 
录 的 起 始 位 置 。 如 果 eo 的 值 为 0， 即 当 目录 对 应 表 中 不 存在 空 记 
录 时 ， 设 置 dp 的 inode 更 新 标志 位 。 


67~68 ”如 果 在 目录 的 记录 中 未 找到 对 象 记录 ， 将 引发 ENOENT 错 


» 


误 。 


71 当 u.u_offset[1] 指向 块 (512 字 节 ) 的 边界 时 的 处 理 。 
请 注意 ， 在 首次 遍历 某 个 目录 的 记录 时 一 定 会 执行 此 处 理 。 


72~73 ”如 果 bp 已 持 有 块 设备 缓冲 区 ， 则 释放 。 

74~75 ” 读 取 下 一 个 块 。 

78 ”从 块 设备 缓冲 区 向 u.u_dent 复制 目录 对 应 表 中 的 一 条 记 
录 。u,uU_ dent,u_ino 表示 inode 编号 ，u.,u_dent.u_name 表 
示 文 件 或 目录 名 。 


79 将 u.u_offset[1] 与 16 (一 条 记录 的 长 度 ) 相 加 。 每 处 理 
一 条 记录 ， 就 将 u.u_offset[1] 的 值 增 加 16。 


80 “递减 uU.u_count 。 每 处 理 一 条 记录 ， 束 将 U.u_count 的 
值 减 去 1。 


81 UuU,uU dent.u_ ino 为 0《〈 即 空 记录 ) 时 的 处 理 。 
82~84 ”如 果 eo 的 值 为 0， 则 将 eo 设 定 为 u.u_offset[1]， 
使 eo 指向 当前 目录 对 应 表 中 空 记 录 之 后 的 一 条 记录 。 返 回 至 


eloop 检查 下 一 条 记录 。 


86~88 将 u.u dbuf 中 保存 的 字符 串 和 u.u_dent.u_name 中 
的 字符 串 进 行 比较 ， 如 果 不 一 致 则 返回 至 eloop 检查 下 一 条 记 
录 。u,uU_ dent,u name - u.u_dbuf 用 来 计算 


uU,uUdent,u_name 和 u,u_ dbuf 地 址 之 差 ， 加 上 *cp (指向 
u.,u_dbuf 中 的 第 x 个 字符 ) 后 即 可 指向 u,u_dent.u_name 中 
的 第 x 个 字符 。 如 果 字 符 串 一 致 则 表示 在 dp 代表 的 目录 中 找到 了 
与 u.U_dbuf 相对 应 的 记录 。 


90~91 ”如 果 bp 已 有 块 设备 缓冲 区 ， 则 将 其 释放 。 


92~96 ”如 采 准 备 删 除 文 件 或 目录 ， 且 已 到 达 路 径 名 的 末尾 ， 则 检 
本 是 否 具 有 对 该 文件 或 目录 的 父 目录 的 写 入 权限 ， 如 琳 具 有 权限 
则 返回 dp 。 


假设 路 径 名 为 “home/hoge/fuga”， 且 准备 删除 “fuga”* 时 ， 确 

认 “hoge” 目 录 下 存在 名 为 “fuga” 的 文件 或 目录 。 如 果 对 “hoge” 具 有 
瑟 入 权限 则 返回 与 “hoge” 相 对 应 的 ijnode[] 元 素 。 调 用 

namei( ) 的 函数 ， 通 过 祖 除 父 目 了 永 对 应 表 中 相应 记录 的 inode 编 
号 ， 达 到 删除 文件 或 目录 的 目的 。 


97~101 ”释放 dp 指向 的 inode[] 元 素 。 将 在 目录 对 应 表 中 找到 
的 记录 相对 应 的 inode[] 元 素 赋予 dp 。 


102 ”返回 至 cloop 。 


access() 


access( ) 用 来 检查 文件 的 权限 设 定 ( 表 9-23， 代 码 清单 9-27 ) 。 将 
由 参数 指定 的 mode ( 读 取 、 写 入 、 执 行 ) 与 Inode[] 元 素 的 
i_mode 的 低位 9 比特 进行 比较 ， 确 认 是 否 具 有 相应 的 权限 。 

inode .i_mode 的 低位 9 比特 表示 文件 的 权限 设 定 ， 从 高 位 开始 以 3 
1 组 ， 分 别 表 示 文 件 拥有 者 、 组 用 户 以 及 其 他 用 户 具有 的 权 


如 膝 是 写 入 ， 那 么 不 能 将 文件 系统 本 映 设置 为 只 读 状 态 。 此 外 ， 作 为 
代码 段 被 使 用 的 文件 也 不 能 写 入 。 


超级 用 户 (user .u_uid 为 0) 一 定 会 有 权限 。 但 是 如 果 没 有 为 文件 
拥有 者 、 组 用 户 以 及 其 他 用 户 的 其 中 之 一 设 定 执行 权限 ， 那 么 即使 是 
超级 用 户 ， 也 无 法 执行 该 文件 。 


如 果 具 有 权限 则 返回 0， 否 则 返回 1。 此外， 权限 不 足 时 u.u_error 
被 设置 为 错误 代码 。 


表 9-23 access( 的 参数 


1 access(aip, mode) 
2 int *aip; 


3 4 


register *ip, m; 


ip = aip, 
m = mode; 
if(m == IWRITE) { 
if(getfs(ip->i dev)->s_ronly != 0) { 
U,.U_error = EROFS,; 
return(1); 


} 

if(ip->i_ flag & ITEXT) { 
U,.U_error = ETXTBSY; 
return(1); 


} 
if(u.u_uid == 0) { 
if(m == IEXEC && (ip->i _ mode & 


(IEXEC | (IEXEC>>3) | (IEXEC>>6))) == 


goto bad; 
return(0); 
if(u.u_uid != ip->i uid) { 
m =>> 3; 
if(u.u_gid != ip->i_gid) 
m =>> 3; 


} 
if((ip->i_mode&m) != 0) 


9 ) 


30 return(9) 

31 

32 bad 

33 U.U_error = EACCES,; 
34 return(1); 

35 


9. 


8~17 ”检查 是 合 具 有 和 写 入 权限 时 的 处 理 。 利 用 getfs ( ) 取得 超 


级 块 ， 检 查 是 否 为 只 读 状态 ， 同 时 也 确认 该 文件 不 是 作为 代码 段 
的 文件 8 


18~23 ”超级 用 户 的 处 理 。 


24~30 ”根据 权限 检查 对 象 的 inode[ ] 元 素 与 当前 用 户 的 所 属 关 
系 (文件 拥有 者 、 组 用 户 或 其 他 用 户 ) ， 调 整 参数 mode 的 比特 
位 置 。 对 inode[] 元 素 的 i_mode 与 参数 mode 进行 与 (&) 运 
算 ， 如 果 结 果 不 为 0 则 可 确定 用 户 具 有 访问 权限 。 


8 初始 化 与 同步 


iinit() 


iinit() 读 取 根 人 磁盘 的 超级 块 ， 并 将 其 赋予 mount[] 的 第 一 个 元 素 
(代码 清单 9-28 ) 。 该 函数 在 系统 启动 时 被 main( ) 调用 ， 且 仅 调 用 
一 次 。 


代码 清单 9-28 iinit0 (ken/alloc.c) 


[| 


iinit() 


这 二 


register *cp, *bp; 


(*bdevsw[rootdev.d_ major].d_open)(rootdev, 1); 
bp = bread(rootdev, 1); 
cp = getblk(NODEV); 
if(u.u_error) 
panic("iinit"); 
bcopy(bp->b_addr, cp->b_addr, 256); 


OOONOORODP 


11 brelse(bp); 


12 mount[0].m_bufp = cp; 

13 mount[0].m_dev = rootdev; 
14 cp = cp->b_addr; 

15 cp->s_flock = 0; 

16 cp->s_ilock = 0; 

17 cp->s_ronly = 0; 

18 time[0] = cp->s_time[0]; 

19 time[1] = cp->s_time[1]; 

20 } 


5 ”打开 根 倍 副 的 处 理 。 如 来 古 RK 人 磁盘 则 不 做 任何 处 理 。 
6 ” 读 取 超级 块 的 内 容 。 


7~11 ”取得 NODEV 块 设备 的 缓冲 区 ， 将 超级 块 的 内 容 复 制 到 此 组 
冲 区 ， 并 释放 用 来 读 取 超级 块 的 缓冲 区 。 


12~13 “将 根 磁 熏 注 册 到 mount [0] 。 
14~17 “对 超级 块 解锁 ， 并 清除 只 读 标记 。 
18~19 ”将 表示 时 间 的 time 复制 到 超级 块 的 filsys.s_time 


O 〇 


Update() 


update( ) 用 来 同步 内 存 中 的 数据 和 块 设备 中 的 数据 (代码 清单 9-29 
) 。 该 函数 将 尚未 写 入 块 设备 的 mount[] 、inode[] 和 buf[] 的 内 
容 写 入 块 设备 。 


代码 清单 9-29 _ update() (ken/alloc.c) 


pdate() 


1u 

2 

3 register struct inode *ip; 
4 register struct mount *mp; 
5 register *bp; 

6 


7 if(updlock) 


8 return; 
9 updlock++; 
10 for(mp = &mount[0]; mp < &mount [NMOUNT]; mp++) 
11 if(mp->m_bufp != NULL) { 
12 ip = mp->m_bufp->b_addr; 
13 if(ip->s_fmod==0 || ip->s_ilock!=0 || 
14 ip->s_flock!=0 || ip->s_ronly!=0) 
15 continue; 
16 bp = getblk(mp->m_dev, 1); 
17 ip->s_fmod = 0; 
18 ip->s_time[0] = time[0]; 
19 ip->s_time[1] = time[1]; 
20 bcopy(ip, bp->b_addr, 256); 
21 bwrite(bp); 
22 } 
23 for(ip = &inode[0]; ip < &inode[NINODE]; ip++) 
24 if((ip->i_ flag&ILOCK) == 0) { 
25 ip->i_flag =| ILOCK.; 
26 iupdat(ip, time); 
27 prele(ip); 
28 } 
29 updlock = 0; 
30 bflush(NODEV); 
31 } 


7~9 ”取得 updlock 的 锁 。 如 果 已 被 加 锁 ， 则 不 做 任何 处 理 立 即 
返回 。updlock 是 用 于 排他 处 理 的 变量 (代码 清单 9-30) 。 


代码 清单 9-30 updlock (system.h) 


1 int updlock 


10 ”遍历 mount[]。 


11~15 如果 未 设置 元 素 的 更 新 标志 位 ， 或 已 被 加 锁 ， 或 处 于 只 读 
状态 ， 则 对 该 元 到 不 做 任何 处 理 。 


16 ” 读 取 超级 块 的 内 容 。 


17 ”清除 更 新 标志 位 。 
18~19 ”更 新 超级 块 的 filsys.s_time 。 


将 超级 块 的 内 容 复 制 到 缓冲 区 ， 并 将 缓 促 区 的 内 容 写 入 块 
设备 避 


23~28 ”遍历 inode[] 。 如 果 元 素 未 被 加 锁 ， 则 加 锁 后 调用 
iupdat()， 将 inode[] 元 素 的 内 容 写 入 块 设备 。 


29 释放 updlock 上 的 锁 。 


30 ”调用 bflush() 刷新 块 设备 的 缓冲 区 。 因 为 参数 为 NODEV 
， 所 以 会 刷新 所 有 设备 的 块 设备 缓冲 区 。 


9.9 小 结 
块 设备 的 结构 通过 文件 系统 得 以 抽象 化 。 
数据 通过 文件 、 目 录 以 及 树 状 结构 的 命名 空间 进行 管理 。 


文件 用 来 表现 数据 本 身 ， 而 目录 是 用 来 管理 下 一 层 文件 或 目录 的 
容器 。 


目录 具有 与 文件 相同 的 实体 。 目 隶 持 有 下 一 层 文件 或 目录 的 inode 
编号 和 文件 名 。 


可 以 对 文件 或 目 孙 设 定 访问 权限 。 
通过 挂 载 或 凶 载 可 以 导入 或 除去 多 个 块 设备 的 文件 系统 。 


块 设备 的 区 域 可 分 为 以 下 4 种 : 局 动用 区 域 、 超 级 块 、inode 区 域 
和 存储 区 域 。 


超级 块 用 来 管理 块 设备 的 控制 信息 。 
inode 用 来 管理 文件 的 定义 信息 。 
。 存储 区 域 的 块 用 来 保存 数据 本 里 。 


。 文件 的 实体 由 1 个 inode 和 多 个 存储 区 域 的 块 组 成 。 
。 文件 使 用 的 存储 区 域 的 块 可 通过 inode 的 映射 获取 。 


。 从 inode 到 存 取 区 域 的 映射 分 为 以 下 3 种 : 直接 参照 、 间 搂 参 照 和 
双重 间接 参照 。 


。 林 使 用 inode 和 存储 区 域 的 未 使 用 块 由 超级 块 的 空 几 队列 管理 。 
。 通过 重复 下 述 处 理 可 以 从 路 径 名 获取 相应 文件 (的 inode) : 首先 


取得 路 径 名 中 的 一 个 元 素 ， 然 后 取得 目录 对 应 表 相 应 记 杂 中 的 
inode， 再 取得 路 径 名 中 的 下 一 个 元 素 。 


第 10 章 文件 处 理 
10.1 用 户 程序 对 文件 的 处 理 


用 户 程序 处 理 文件 时 ， 流 程 如 下 所 示 。 
1. 使 用 路 径 名 打开 准备 进行 处 理 的 文件 ， 如 果 成 功 ， 则 可 以 获取 文件 


描述 符 。 


0 


3. 处 理 完毕 后 关闭 文件 。 


如 果 用 C 语言 进行 挤 述 ， 上 述 流程 可 以 表现 为 代码 请 单 10-1 的 代码 。 
代码 清单 10-1 文件 处 理 的 示例 代码 


1 main() { 

2 int fd; 

3 char buf[100]; 

4 fd = open("filename.txt", 2); 


read(fd, buf, 10); 
buf[0] = "a"; 
seek(fd, 0, 0); 
write(fd, buf, 10); 
close(fd); 


©OOWNO 


4 将 文件 路 径 作 为 参数 ， 以 读 写 模式 打开 ， 如 果 成 功 则 返回 文件 


描述 符 。 

5 “将 位 于 文件 头 部 的 10 字 节 数据 读 入 buf 。 
6 更 新 读 取 的 数据 。 

7 ”将 文件 偏 移 量 移动 至 文件 起 始 位 置 。 

8 ”将 更 新 后 的 数据 写 入 文件 。 

9 ”关闭 文件 ， 结 束 对 文件 的 处 理 。 


open()、read()、seek() 、write()、close() 是 由 C 语言 库 
提供 的 操作 文件 的 函数 。 这 些 函 数 通过 执行 系统 调用 处 理 文件 。 


10.2 3 个 结构 体 


文件 处 理 通 过 3 个 结构 体 管理 。user .u_ofile[] 负责 管理 由 进程 打 
开 的 文件 ，file 结构 体 的 数组 file[] 用 来 管理 已 被 打开 的 文件 的 处 
理 信 息 (代码 清单 10-2， 表 10-1 ) 。inode[] 表示 读 取 到 内 存 的 


inode 信息 。 


因为 每 一 个 file[] 元 和 聚 都 各 目 持 有 文件 侦 移 量 和 文件 访问 模式 ， 所 
以 即使 有 两 个 进程 同时 打开 同一 文件 ， 且 其 中 一 个 进程 将 文件 偏 移 量 
也 不 会 对 由 男 一 个 进程 打开 的 文件 的 文件 偏 移 量 产生 影 
B00 。 


当 进 程 打开 某 个 文件 之 后 ， 该 进程 被 赋予 user .u_ofile[] 和 
file[] 的 元 素 ， 且 user .u_ofile[] 元 素 指 向 file[] 元 素 ， 而 


file[] 元 素 指向 inode[] 元 素 (图 10-1) 。user.u_ofile[] 的 
数组 下 标 将 返还 给 用 户 程序 ， 该 下 标 被 称 为 文件 描述 符 。 用 户 程序 通 
过 文件 描述 符 对 文件 进行 操作 。 


关闭 文件 时 ， 与 打开 文件 时 相反 ， 将 释放 user.u_ofile[]、 
file[] 和 inode[] 元 素 。 


进程 1 


user.u_ofile[] file[] inodel] 


count=1 


进程 2 
进程 user.u_ofile[] 


图 10-1 打开 文件 
代码 清单 10-2 file (file.h) 


char *f_offset[2]; 
} file[NFILE]; 


1 struct file 

2 

3 char f_flag; 
4 char f_count; 
5 int f_inode; 
6 

7 

8 


9 /* flags */ 


10 #define FREAD 01 
11 #define FWRITE 02 
12 #define FPIPE 04 


表 10-1 file 结构 体 


含义 


° 参见 表 9-2 


以 读 取 模式 打开 。 不 具备 文件 的 读 取 权限 时 无 法 以 此 模式 打开 文件 


以 写 入 模式 打开 。 不 具备 文件 的 写 入 权限 时 无 法 以 此 模式 打开 文件 


作为 管道 使 用 (参见 第 11 章 ) 


标准 输入 输出 


当 系 统 启动 和 用 户 登 妙 时 ， 执 行 打开 终端 的 处 理 。user .u_ofile[] 
的 第 0 个 元 素 被 用 作 标 准 输入 、 第 1 个 元 素 被 用 作 标 准 输出 ， 而 第 2 
个 元 素 被 用 作 标 准 错误 输出 (图 10-2 ) 


user.u_ofilel] 
标准 输入 | 0 | 
标准 输出 1 [一 一 一 一 


错误 输出 


系统 启动 或 登录 时 
打开 终端 


图 10-2 标准 输入 输出 


通过 更 改 user .u_ofile[] 的 第 0~2 个 元 素 ， 可 以 实现 重 定向 或 管 
道 功能 。 比 如 关闭 user .u_ofile[1] ， 并 将 其 设 定 为 普通 文件 后 ， 
程序 向 标准 输出 写 入 的 内 容 ， 将 被 输出 至 该 文件 (图 10-3 ) 。 管 道 的 
内 容 请 参照 第 11 章 。 类 似 这 种 改变 输出 对 象 的 处 理 ， 一 般 通 过 Shell 
程序 进行 。 


程序 user.u_ofilel] 


程序 以 为 是 向 标 


准 输 出 (终端 ) 
输出 数据 实际 数据 被 
输出 到 文件 
图 10-3 重 定 向 


10.3 ”文件 的 生成 和 打开 处 理 
文件 的 生成 和 打开 基本 由 共用 处 理 实现 。 


系统 调用 creat 


系统 调用 creat 生成 新 的 文件 ， 并 将 其 打开 。 该 文件 已 存在 时 ， 将 文 
件 长 度 设 定 为 0 并 将 其 打开 。creat() 为 系统 调用 creat 的 处 理 函 
数 ( 表 10-3， 代 码 清单 10-3 ) 。 


表 10-3 系统 调用 creat 的 参数 


已 存在 时 不 使 用 


register *ip; 
extern uchar; 


ip = namei(&uchar, 1); 
if(ip == NULL) { 
if(u.u_error) 
return; 
ip = maknode(u.u_arg[1]&07777&(~ISVTX)); 
if (ip==NULL) 
return; 
openi(ip, FWRITE, 2); 
} else 
openi(ip, FWRITE, 1); 


6 ”和 疾 试 获取 与 用 户 程 序 设 定 的 路 径 相对 应 的 inode[] 元 素 。 


7~13 ”如 有 果 通 过 namei( ) 无 法 取得 inode[] 元 丸 ， 则 答 试 生成 
新 的 文件 。 将 maknode( ) 的 参数 设 定 为 用 户 程序 指定 的 模式 。 
但 是 ， 由 于 清除 了 模式 的 高 位 比特 (010000 以 上 ) ， 因 此 无 法 生 
成 目录 (IFDIR=040000) ， 也 无 法 设 定 Sticky bit 。 


生成 文件 后 执行 open1( ) 。open1( ) 是 生成 并 打开 文件 的 共用 
阔 数 ， 第 3 个 参数 的 2 表示 正在 生成 新 的 文件 。 


14~15 ”如果 通过 namei( ) 成 功 取得 jnode[] 元 闵 ， 则 使 用 该 
元 素 。open1( ) 的 第 3 个 参数 的 1 表示 正在 对 已 存在 的 文件 进行 
初始 化 处 理 。 


maknodel() 


maknode( ) 用 来 生成 新 的 文件 ( 表 10-4， 代 码 清 单 10-4 ) 。 首 先 执 
行 ialloc( ) 从 空闲 队列 中 获取 ijnode[] 元素， 执行 wdir() 向 目 


录 的 对 应 表 追 加 记录 ， 然 后 将 jnode[] 元 素 返 还 给 调用 者 。 
表 10-4 maknode() 的 参数 


maknode (mode) 
{ 


register *ip; 


if (ip==NULL) 
return(NULL); 
ip->i_flag =| IACC|IUPD; 
ip->i_mode = mode|IALLOC; 
10 ip->i_nlink = 1; 
11 ip->i_uid = u.u_uid; 
12 ip->i_gid = u.u_gid; 


1 
2 
3 
4 
5 ip = ialloc(u.u_pdir->i_dev); 
6 
7 
8 
9 


13 wdir(Iip)， 
14 return(ip); 


5~7 U.Uu_pdir 指 疝 准备 在 其 中 生成 狐 文 件 的 目录 。Uu.u_pdir 
由 在 maknode( ) 之 前 执行 的 namei( ) 设 定 。 


wdir() 

wdir() 向 目录 的 对 应 表 中 追加 新 的 记录 ( 表 10-5， 代 码 清单 10- 

5) 。 通 过 namei() ， 将 追加 对 象 的 父 目录 、 追 加 对 象 的 文件 或 目录 
以 及 父 目录 对 应 表 中 的 偏 移 量 设 置 在 user 结构 体 中 (图 10-4 


用 u.u_pdir 表 示 的 目录 


inode 编号 文件 或 目录 名 
2 字 节 14 字 节 


U.U_offset 一 -> 


U.u_dent.u_ino u.u_dent.u_name 


通过 namei() 设 定 一 一 一 一 一 yu.u_dbuf 


图 10-4 wdir() 


由 于 目录 的 实体 是 文件 ， 因 此 采取 了 与 文件 相同 的 方法 调用 
writei() 更 新 目录 数据 。 


表 10-5 wdir0 的 参数 


3 


代码 清单 10-5 wdir() (ken/iget.c) 


register char *cp1，*cp2 


uU.u_dent.u_ino = ip->i_number; 

cp1 = &u.u_dent.u_name[0]; 

for(cp2 = &u.u_dbuf[0]; cp2 < &u.u_dbuf[DIRSIZ];) 
*Cp1++ = *Cp2++; 


U.U_count = DIRSIZ+2 ， 
u.u_segflg = 1; 
U,U_base = &u.u_dent; 
writei(u.u_pdir); 
iput(u.u_pdir); 


14 ”对 于 在 其 中 追加 文件 或 目录 的 目录 ，namei( ) 递增 了 它 的 参 
照 计数 器 ， 此 处 则 递减 该 计数 右 。 


系统 调用 open 


系统 调用 open 用 于 打开 文件 。open( ) 是 系统 调用 open 的 处 理 函 数 
( 表 10-6， 代 码 清 单 10-6 ) 。 


表 10-6 系统 调用 open 的 参数 


Pr 


下 
打开 文件 时 的 模式 。 如 采 不 具备 该 模式 的 权限 则 无 法 打开 文件 


代码 清单 10-6 ” open) (ken/sys2.c) 


open() 

{ 
register *ip; 
extern uchar; 


ip = namei(&uchar, 0); 
if(ip == NULL) 


return; 
u.u_arg[1]++; 
openi(ip, u.u_arg[1], 0); 


OOONOOORRODP 


6~8 ” 笑 试 取得 与 用 户 程 序 指定 的 路 径 名 相对 应 的 ijnode[] 元 


力 \ 


9 ”系统 调用 pen 的 参数 mode ， 它 的 可 选 值 如 下 : 0 为 读 取 ，1 
为 写 入 。 对 file 结构 体 的 标志 变量 而 言 ， 则 是 1 为 读 取 ，2 为 写 
入 ， 因 此 需要 在 此 处 加 1 进行 调整 。 


10 ”执行 open1( ) ， 进行 生 成 及 打开 文件 的 共用 处 理 。 第 3 个 
参数 的 0 表示 试图 打开 已 存在 的 文件 。 


open1() 


open1( ) 用 来 执行 生成 及 打开 文件 的 共用 人 处理 ( 表 10-7， 代 码 清 单 
10-7) 。 


试图 打开 已 存在 的 文件 时 执行 access( ) ， 以 检查 是 否 具 有 访问 权 
限 。 生 成 新 文件 时 ， 执 行 jtrunc() 将 文件 的 长 度 设置 为 0。 


随后 ， 执 行 falloc() 从 user.u_ofile[] 和 file[] 中 取得 新 的 
元 素 ， 将 file[] 元 素 指 向 与 准备 打开 的 文件 相对 应 的 ijnode[] 元 
素 o 


表 10-7 open10 的 参数 


参 
| 


[] 元 
示 是 准备 读 取 文 件 ， 


开 已 存在 的 文件 。1 : 准备 生成 新 的 文件 ， 且 该 文件 已 经 存在 。2 
新 的 文件 ， 但 该 文件 不 存在 


1 open1(Ip，mode，trf) 
2 int *ip; 


3 1 

4 register Struct file *fp; 

5 register *rip, m; 

6 int 工 ; 

7 

8 rip = ip; 

9 m = mode; 
10 if(trf != 2) { 

11 if (m&FREAD ) 

12 access(rip, IREAD); 

13 if(m&FWRITE) { 

14 access(rip, IWRITE); 

15 if((rip->i mode&IFMT) == IFDIR) 
16 U.U_error = EISDIR; 
17 } 


19 if(u.u_error) 


20 goto out ; 

21 if(trf) 

22 itrunc(rip); 

23 prele(rip); 

24 if ((fp = falloc()) == NULL) 
25 goto out; 

26 fp->f_flag = m&(FREAD|FWRITE); 
27 fp->f_inode = rip; 

28 i= Uu.u_arO[RO]; 

29 openi(rip, m&FWRITE); 

30 if(u.u_error == 0) 

31 return; 

32 u.u_ofile[i] = NULL; 

33 fp->f_count--; 

34 

35 Out : 

36 iput(rip); 

37 } 


10~18 ”文件 已 存在 时 检查 相应 的 访问 权限 。 准 备 读 取 文件 时 检查 


古人 否 具 有 读 取 权限 ， 准 备 写 入 文件 时 则 检查 是 否 具 有 写 入 权限 。 
但 是 不 允许 对 目录 进行 写 入 。 


19~20 ”没有 访问 权限 时 ， 在 access() 内 将 错误 代码 赋予 


U.U_error ° 


21~22 如果 系统 调用 creat 处 于 执行 中 的 状态 ， 则 执行 
itrunc( ) 将 文件 长 度 设 定 为 0。 


23 将 inode[] 元 素 解 锁 。 该 元 素 在 ialloc() 或 namei() 
执行 的 iget() 中 被 加 锁 。 


24~27 从 user.u_ofile[] 和 file[] 取得 新 的 元 素 。 


28 在 falloc() 执行 的 ufalloc() 中 ， 将 用 户 进程 的 rg 设 
定 为 从 user.u_ofile[] 中 取得 的 元 到 的 数组 下 标 。 这 个 值 将 
被 返还 给 用 户 进程 。 如 果 在 此 后 的 处 理 中 发 生 错 误 ， 则 需要 在 第 
32 行 释放 所 取得 的 user .u_ofile[] 元 素 ， 因 此 ， 此 处 将 下 标 
暂时 保存 于 i 中 。 


29 ”执行 openi()。 如果 是 一 般 文件 则 不 做 任何 处 理 。 


30~31 ”如 条 在 openi( ) 中 未 发 生 错误 ， 则 认为 处 理 成 功 ， 返 回 
调用 者 。 


32~36 ”如 果 在 openi( ) 中 发 生 错 误 ， 则 释放 从 
user .u_ofile[] 中 取得 的 元 素 ， 并 递减 file[] 元 素 和 
inodef[] 元 素 的 参照 计数 器 。 


falloc() 


falloc( ) 用 来 分 配 user ,u_ofile[] 和 file[] 的 元 素 (代码 清 
单 10-8 ) 。 首 先 ， 调 用 ualloc( ) 取得 user.u_ofile[] 的 元 素 ， 
然后 寻找 file[] 的 空 闪 元 素 。 如 果 发 现 空 内 元 素 ， 则 将 通过 
ualloc( ) 取得 的 user .u_ofile[] 元 素 指向 该 file[] 元 素 。 


代码 清单 10-8 falloc() (ken/fio.c) 


alloc() 


register struct file *fp; 
register i; 


if ((i = ufalloc()) < 0) 
return(NULL); 
for (fp = &file[0]; fp < &file[NFILE]; fp++) 
if (fp->f_count==0) { 
u.u_ofile[i] = fp; 
fp->f_count++; 
fp->f_offset[0] 0 ; 
fp->f_offset[1] 0 ; 
return(fp); 


} 
printf("no file\n"); 
U,.U_error = ENFILE; 
return(NULL); 


6~7 从 user.u_ofile[] 中 取得 空 果 元 素 。ufal1loc( ) 返回 
所 取得 的 user ,u_ofile[] 元 素 的 数组 下 标 。 


8~15 “寻找 file[] 的 空闲 元 素 (参照 计数 器 的 值 为 0 。 找 到 
后 将 刚才 取得 的 user,u_ofiler] 元 素 的 值 设 定 为 指向 该 
file[] 元 素 的 指针 ， 然 后 递增 file[] 元 素 的 参照 计数 器 ， 并 
将 文件 中 偏 移 量 的 初始 值 设 定 为 0。 


16~18 ”如 采 在 file[] 中 未 找到 空 朵 元 系 ， 则 进行 错误 处 理 。 


ufalloc() 

ufalloc() 从 user.u_ofile[] 中 取得 新 的 元 素 (代码 清单 10-9 

) 。 该 函数 在 user ,u_ofile[] 中 寻找 空闲 元 素 ， 找 到 后 将 该 元 素 
的 数组 下 标 赋予 用 户 进 程 的 ro ， 并 将 下 标 作为 返回 值 返 还 给 调用 者 。 


代码 清单 10-9 ufalloc() (ken/fio.c) 


falloc() 


U 
{ 


register 工 


for (i=0; i<NOFILE; i++) 
if (u.u_ofile[i] == NULL) { 
U.Uu_arQO[RO] = i; 
return(i); 


Uu.uU_error = EMFILE; 
return(-1); 


openi() 


openi( ) 在 对 象 为 特殊 文件 时 执行 打开 设备 的 处 理 ( 表 10-8， 代 码 清 
单 10-10 ) 。 如 果 对 象 为 一 般 文件 ， 则 不 做 任何 处 理 。 


表 10-8 openi0 的 参数 


| ” 
三 元 二 


写 入 处 理 


a 


代码 清单 10-10 openi() (ken/fio.c) 


1 openi(ip, rw) 

2 int *ip; 

3 1 
register *rip; 
register dev, maj; 


rip = ip, 

dev rip->i_addr[90]; 

maj = rip->i_addr[0].d_major; 
switch(rip->i_ mode&IFMT) { 


case IFCHR: 
If(maj >= nchrdev) 
goto bad; 


(*cdevsw[maj].d_open)(dev, rw); 
break; 


case IFBLK: 
If(maj >= nblkdev) 
goto bad; 
(*bdevsw[maj].d_open)(dev, rw); 


return; 


u.u_error = ENXIO; 


8~9 ”如 果 是 特殊 文件 ，inode .i_addr[9] 会 被 设置 为 设备 编 
et 此 处 会 获取 设备 的 
编号 。 


10~23 ”检查 ijnode.i_mode 。 如 果 是 特殊 文件 则 执行 打开 设备 
的 处 理 。IFCHR 表示 字符 设备 ，IFBLK 表示 块 设 备 。 


10.4 ”文件 的 读 取 和 写 入 


系统 调用 read 、write 


read( ) 是 系统 调用 read 的 处 理 函 数 ( 表 10-9， 代 码 清单 10-11 ) ， 
该 系统 调用 用 于 读 取 文件 。write( ) 是 系统 调用 write 的 处 理 函 数 
( 表 10-10， 代 码 清单 10-12 ) ， 该 系统 调用 用 于 将 数据 写 入 文件 。 


文件 的 读 取 与 写 入 在 数据 的 流动 方向 上 是 相反 的 (内存 ~ 磁盘， 及 磁 

盘 - 内 存 ) ， 但 是 处 理 本 身 基 本 上 是 相同 的 〈 图 10-5 ) 。 相 同 的 处 理 
部 分 由 rdwr( ) 实现 。read() 和 write() 只 是 将 file 结构 体 的 标 
志 位 FREAD 和 FWRITE 作为 参数 调用 rdwr() 。 


数据 流向 相反 ， 但 是 
处 理 本 身 基 本 相同 


图 10-5 read 和 write 
表 10-9 系统 调用 read 的 参数 


PN sett 
. 


代码 清单 10-11 read() (ken/sys2.0) 


ead() 


1r 
2 
3 rdwr (FREAD ) ; 
4 } 


表 10-10 系统 调用 write 的 参数 


文件 描述 符 


含义 
存放 写 入 数据 的 虚拟 地 址 (以 字 节 为 单位 ) 
| 


代码 清单 10-12 write() (kenm/sys2.0) 


2 【{ 


3 rdwr (FWRITE); 
4 } 


rdwr() 


rdwr ( ) 用 来 实现 read( ) 和 write() 的 共用 处 理 ( 表 10-11， 代 码 
清单 10-13 ) 。 首 先 为 u.u_base 、u.u_count 、u.u_offset 和 
u.u_segflg 设 定 适 当 的 值 ， 然 后 调用 readi() 和 writei() 。 


用 户 进程 的 r9 
返回 值 。 用 户 程序 可 通过 返回 值 来 判断 读 写 处 理 是 否 正 常 


表 10-11 rdwr() 的 参数 


1 rdwr(mode) 

2 

3 register *fp, m; 

4 

5 m = mode; 

6 fp = getf(u.u_arO[RO]); 

7 if(fp == NULL) 

8 return; 

9 if((fp->f_flag&m) == ©0) { 
10 U,.U_error = EBADF; 
11 return; 

12 } 

13 uU.u_base = u.u_arg[0]; 
14 U.Uu_count = u.u_arg[1]; 
15 u.u_segflg = 0; 


16 if(fp->f_flag&FPIPE) { 


17 if(m==FREAD ) 


18 readp(fp); else 

19 writep(fp)， 

20 } else { 

21 u.u_offset[1] = fp->f_offset[1]; 
22 u.u_offset[0] = fp->f_offset[0]; 
23 if (m==FREAD) 

24 readi(fp->f_inode); else 

25 writei(fp->f_inode); 

26 dpadd(fp->f_offset, u.u_arg[1]-u.u_count); 
27 } 

28 U.Uu_arO[RO] = u.u_arg[1]-u.u_count; 
29 } 


执行 getf( ) ， 取 得 与 文件 描述 符 相 对 应 的 file[] 元 


9~12 ”将 file[] 元 素 的 标志 位 和 通过 参数 设 定 的 读 写 模式 相 比 


较 ， 确 认 是 否 具 有 所 需 的 权限 。 


13~15 “为 了 执行 readi() 和 writei() ， 首 先 设 定 U,uU_base 
\`U,U_count 和 u.uU_ segf1g 。 


16~19 “如 果 准 备 读 写 的 文件 为 管道 时 的 处 理 。 请 参照 第 11 章 。 


20~27 ”如果 准备 读 写 的 文件 为 一 般 文件 时 的 处 理 。 将 
u.U_offset 设 定 为 filef[] 元 素 的 文件 偏 移 量 。 到 此 为 止 ， 所 
需 的 参数 都 已 设置 完毕 ， 可 以 执行 readi() 或 writei()。 执 
将 file[] 元 素 的 文件 偏 移 量 加 上 实际 读 写 的 字 方 


28 “将 用 户 进程 的 r9 设 定 为 实际 读 写 的 子 广 数 ， 并 将 其 作为 系 
统 调用 的 返回 值 。 


readi() 


Ct oo ( 表 10-13， 代 码 清单 10-14 ) 。 地 址 和 传送 量 
参数 通过 user 结构 体 进 行 设 定 〈 表 10-12 ) 。 


执行 bmap( ) ， 将 逻辑 块 编号 变换 为 物理 块 编号 ， 并 以 块 单位 7 
节 ) 进行 读 取 操 作 。 如 果 是 对 分 散在 8 个 块 中 长 度 为 4KB 的 数据 进 
读 取 ， 需 要 读 取 8 次 。 


readi() 具有 预 读 取 的 功能 。 如 果 判 断 正 在 对 某 个 文件 的 块 进行 连续 
读 取 时 ， 将 通过 breada( ) 进行 异步 的 预 读 取 处 理 。 


表 10-12 ”readi0 的 参数 


存放 读 取 数据 的 虚拟 地 址 (以 字 节 为 单 人 
文件 中 的 偏 移 量 (以 字 节 为 单位 ) 


i 训 取 至 内核 间 ，0， 了 到 用 记 


代码 清单 10-14 readi() (kem/rdwri.o) 


1 readi(aip) 
2 struct inode *aip; 


3 4{ 
4 
5 
6 


int *bp; 
int lbn, bn, on; 
register dn, n; 


7 register Struct inode *ip; 


8 

9 ip = aip; 

10 if(u.u_count == 0) 

11 return; 

12 ip->i_flag =| IACC; 

13 if((ip->i mode&IFMT) == IFCHR) { 

14 (*cdevsw[ip->i_addr[0].d major].d_read)(ip->i_addr[0]); 
15 return; 

16 } 

17 

18 do { 

19 lbn = bn = lshift(u.u_offset, -9); 
20 on = u.u_offset[1] & 0777; 

21 n = min(512-on, u.u_count); 

22 if((ip->i mode&IFMT) != IFBLK) { 
23 dn = dpcmp(ip->i_size0&0377, ip->i_sizel, 
24 u.u_offset[0], u.u_offset[1]); 
25 if(dn <= 0) 

26 return; 

27 n= min(n, dn); 

28 If ((bn = bmap(ip, lbn)) == 0) 
29 return; 

30 dn = ip->i_dev; 

31 } else { 

32 dn = ip->i_addr[0]; 

33 rablock = bn+1， 

34 

35 If (ip->i_lastr+1 == lbn) 

36 bp = breada(dn, bn, rablock); 
37 else 

38 bp = bread(dn, bn); 

39 ip->i_lastr = lbn; 

40 iomove(bp, on, n, B_READ); 

41 brelse(bp); 

42 } while(u.u_error==0 && U.Uu_count!=0); 
43 } 


10~11 ”如 果 读 取 的 数据 长 度 为 0 时， 不 做 任何 处 理 立即 返回 。 


12 ”设置 ijnode[ 1] 元素 的 更 新 标志 位 。 


ou 如 琳 文 件 是 字符 设备 的 特殊 文件 ， 则 调用 该 设备 的 设备 驱 
A O 〇 


19 “通过 文件 侦 移 量 计算 得 到 该 数据 的 逻辑 块 编号 。 

20 ”计算 块 内 的 仿 移 量 

21 计算 读 取 的 数据 长 度 。 并 对 其 调整 使 其 不 会 跨越 多 个 块 。 
22~30 ” 读 取 对 象 为 一 般 文件 时 的 处 理 。 对 每 次 读 取 的 长 度 做 最 终 
调整 ， 使 其 不 会 超过 文件 的 长 度 。 然 后 执行 bmap( ) ， 取 得 存储 
区 域 的 物理 块 编号 。 将 dn 设 定 为 块 设备 编号 。 


31~34 ”如 采 读 取 对 象 是 块 设备 的 特殊 文件 ， 则 将 dn 设 定 为 块 设 
备 编号 ， 并 将 rablock 设 定 为 准备 读 取 的 块 的 下 一 个 块 的 块 编 
号 。 


35~38 ”如 果 读 取 对 象 为 文件 中 连续 的 逻辑 块 ， 则 执行 breada( ) 
读 取 当前 准备 读 取 的 块 ， 并 对 下 一 个 块 进行 异步 的 预 读 取 。 否 则 
执行 bread( ) 进行 一 般 读 取 。 


39 ”为 了 进行 预 读 取 的 判断 ， 将 ijnode .i_1lastr 设 定 为 所 读 取 
的 逻辑 块 编 号 。 


40 ”执行 jomove() ， 将 读 取 的 磁盘 数据 从 缓冲 区 复制 到 进程 的 
虚拟 地 址 。 


41 ”释放 读 取 数据 时 使 用 的 绥 冲 区 。 


42 ”如 采 没 有 发 生 错误 ， 且 需要 的 数据 尚未 读 取 完毕 时 ， 继 续 做 
读 取 处 理 。 


writei() 


writei() 用 于 对 文件 进行 写 入 处 理 ( 表 10-15， 代 码 清单 10-15 ) 。 
a 相同 ， 地 址 和 传送 量 等 参数 也 通过 user 结构 体 进行 设 定 
表 10-14) 。 


执行 bmap( ) ， 将 逻辑 块 编号 变换 为 物理 块 编号 ， 并 以 块 单位 〈512 字 
节 ) 进行 写 入 操作 。 如 果 是 对 分 散在 8 个 块 中 长 度 为 4KB 的 数据 进行 
写 入 ， 则 需要 写 入 8 次 。 


如 采 需 要 对 整个 块 写 入 数据 ， 首 先 执行 getblk( ) 取得 该 块 的 缓冲 
区 。 因 为 授 下 来 要 对 块 进 1 所 以 此 时 无 需 从 磁盘 读 取 块 中 
的 数据 。 如 有 果 只 是 更 新 块 中 的 一 部 分 内 容 ， 则 需要 首先 执行 bread( ) 
从 磁盘 读 取 块 中 当前 的 内 容 ， 多 后 将 需要 更 新 的 那 一 部 分 写 入 缓冲 
区 ， 再 写 入 磁 玛 。 


对 磁盘 进行 写 入 时 ， 如 果 遇 到 块 的 边界 数据 ， 将 被 立即 写 入 磁盘 。 


则 将 进行 延迟 写 入 ， 数 据 不 会 马上 写 入 磁盘 。 
表 10-14 writei0 的 参数 


和 
准备 被 写 入 的 数据 的 虚拟 地 址 (以 字 市 为 单位 ) 
文件 中 的 偏 移 量 (以 字 节 为 单位 ) 


从 风 核 空间 写 入 ，0， 从 用 六 


表 10-15 ”writei0 的 参数 


代码 清单 10-15 writei() (ken/rdwri.c) 


1 writei(aip) 
2 struct inode *aip; 


3 { 


10 


int *bp; 

int n, on; 

register dn, bn; 

register struct inode *ip; 


ip = aip; 

ip->i_flag =| IACC|IUPD; 

if((ip->i mode&IFMT) == IFCHR) { 
(*cdevsw[ip->i_addr[0].d_ major].d_ write)(ip->i_addr[0]); 


return; 
If (uyu.u_count == 0) 
return; 
do { 
bn = lshift(u.u_offset, -9); 
on = u.u_offset[1] & 0777; 


n = min(512-on, Uu.u_count); 
if((ip->i mode&IFMT) != IFBLK) { 
if ((bn = bmap(ip, bn)) == 0) 


return; 
dn = ip->i_dev; 
} else 
dn = ip->i_addr[0]; 


if(n == 512) 
bp = getblk(dn, bn); else 
bp = bread(dn, bn); 
iomove(bp, on, n, B_WRITE); 
if(u.u_error != 0) 
brelse(bp); else 
if ((u.u_offset[1]&0777)==0) 
bawrite(bp); else 
bdwrite(bp); 
if(dpcmp(ip->i_sizeO&0377, ip->i_sizel, 
u.u_offset[0], u.u_offset[1]) < 0 && 
(ip->i_mode&(IFBLK&IFCHR)) == 0) { 
ip->i_ Size0 = u.u_offset[0]; 
ip->i_ Size1 = u.u_offset[1]; 


} 
ip->i_flag =| IUPD; 
} while(u.u_error==0 && U.Uu_count!=0); 


设置 jnode[] 元 么 的 参照 标志 位 和 更 新 标志 位 。 


11~14 “如 条 准备 写 入 的 文件 为 字符 设备 的 特殊 文件 ， 则 调用 该 设 
备 的 设备 张 动 。 


15~16 “如果 准备 写 入 的 数据 长 度 为 0， 则 不 做 任何 处 理 。 


19~21 与 readi() 时 的 处 理 相同 ， 计 算出 逻辑 块 编号 、 块 仿 移 
量 和 写 入 数据 长 度 (对 其 进行 调整 使 数据 不 会 跨越 多 个 块 ) 。 


22~25 ”如 果 准 备 写 入 的 文件 为 一 般 文件 时 ， 执 行 bmap( ) 获取 物 
理 块 编号 ， 并 将 dn 设 定 为 设备 编号 。 


26~27 ”如果 准备 写 入 的 文件 为 块 设备 的 特殊 文件 ， 则 将 dn 设 定 
为 设备 编号 。 

28~30 ”如果 需要 回 整 个 块 写 入 数据 ， 首 先 执行 getblk() 获取 
该 块 的 缓冲 区 。 如 果 只 是 更 新 块 中 的 部 分 内 容 ， 则 首先 执行 
bread( ) 从 磁盘 读 取 块 当前 的 内 容 。 


31 ”执行 iomove( ) 将 准备 写 入 的 数据 从 虚拟 地 址 空间 传送 至 组 
冲 区 。 


34~36 ” 遇 到 块 边界 时 ， 执 行 bawrite() 以 异步 方式 将 数据 立即 
写 入 磁盘 。 否 则 执行 bdwrite( ) 进行 延迟 写 入 。 


37~42 ”如 果 由 于 写 入 使 文件 长 度 增 大 ， 则 增加 inode.i_size 
的 值 。u.u_offset 的 值 为 此 时 文件 未 尾 的 地 址 。 


43 ”设置 jnode[ ] 元 素 的 更 新 标志 位 。 
44 “如果 没有 发 生 错 误 ， 且 需要 的 数据 尚未 写 完 时 ， 继 续 写 入 处 
理 。 


iomovel() 


iomove( ) 用 于 在 虚拟 地 址 空间 和 块 设备 缓冲 区 之 间 传 送 数 据 ( 表 10- 
17， 代 码 清单 10-16 ) 。 与 readi( ) 和 writei() 相同 ， 内 存 地 址 及 
传送 数据 长 度 等 通过 user 结构 体 指定 。 请 注意 ，user 结构 体 的 内 容 
将 被 更 新 ( 表 10-16) 。 


当 以 字 为 单位 对 用 户 空 间 进行 传送 时 ， 使 用 汇编 语言 编写 的 
copyin() 和 copyout() 。 和 否则 使 用 cpass() 和 passc() 以 字 市 
为 单位 进行 传送 。 


表 10-16 iomove0) 的 参数 


,， ,base | 读 写 对 象 的 虚拟 地 址 (以 字 节 为 单位 ) 。 处 理 结束 后 将 递增 
. 的 长 度 值 
; 、 “( 为 单位 ) 。 人 处 理 结束 后 将 被 递增 实际 传送 的 


读 写 数据 量 (以 字 节 为 单位 ) 。 处 理 结束 后 将 被 递减 实际 传送 的 长 度 
一 直 
1 : 从 内 核 空 间 读 写 ，0 : 从 


数据 传送 长 度 《以 字 节 为 单 人 


代码 清单 10-16 iomove0 (ken/rdwri.c) 


1 iomove(bp, o, an, flag) 
2 struct buf *bp; 


register char *cp; 
register int n, t; 


n = an; 
cp = bp->b_addr + 0o; 
if(u.u_segflg==0 && ((n | cp | u.u_base)&01)==0) 
if (flag==B_WRITE) 
cp = copyin(u.u_base, cp, n); 
else 
cp = copyout(cp, u.u_base, n); 
if (cp) { 
Uu.u_error = EFAULT; 
return; 


U.U_base =+ Nn; 
dpadd(u.u_offset, n); 
U.U_count =- n; 
return; 


} 
if (flag==B_WRITE) { 
while(n--) 
if ((t = cpass()) < 0) 
return; 
*Cp++ = 七 ， 


} else 
while (n--) 
if(passc(*cp++) < 0) 
return; 


9~22 ”从 用 户 空间 传送 数据 。 如 果 传 送 长 度 、 缓 促 区 内 偏 移 量 、 
内 存 地 址 都 以 字 为 单位 (偶数) ， 则 使 用 copyin() 和 
copyout().。: 


23~32 ”否则 使 用 passc() ( 表 10-18， 代 码 清单 10-17) 和 
cpass() (代码 清单 10-18) 。 这 两 个 函数 以 字 节 为 单位 传送 数 
据 ， 如 果 是 在 内 核 空间 内 部 进行 传送 ， 只 需 进行 单纯 的 数据 复制 
即 可 。 如 果 是 在 用 户 空间 和 内 核 空间 之 间 传 送 数 据 ， 则 需要 调用 
subyte() 和 fubyte()。 


表 10-18 passc( 的 参数 


if(u.u_segflg) 
*U.U_base = c; else 
if(subyte(u.u_base, c) < 0) { 
Uu.u_error = EFAULT; 
return(-1); 


} 


U.U_count--; 

if(++u.Uu_offset[1] == 0) 
u.u_offset[0]++; 

U.U_baset+t; 

return(u.u_count == 0? -1: 0); 


1 cpass() 

2 

3 register c; 

4 

5 if(u.u_count == 0) 

6 return(-1); 

7 if(u.u_segflg) 

8 c= *uU,U_base; else 

9 if((c=fubyte(u.u_base)) < 0) { 
10 U.Uu_error = EFAULT,; 
11 return(-1); 
12 } 


13 U,U_count--; 


14 if(++u.Uu_offset[1] == 0) 


15 u.u_offset[0]++; 
16 U.U_baset+t; 

17 return(c&0377); 

18 } 


getfQ) 


getf( ) 根据 用 户 程序 指定 的 文件 描述 符 ， 返 回 对 应 的 
user,u_ofile[] 元 素 ( 表 10-19， 代 码 清单 10-19 ) 。 


表 10-19 ”getf0 的 参数 


register *fp, rf; 


rf = f; 

if(rf<0 || rf>=NOFILE) 
goto bad; 

fp = u.u_ofile[rf]; 

if(fp != NULL) 
return(fp); 


u.uU_error = EBADF; 
return(NULL); 


10.5 ”指定 文件 的 读 写 位 置 
系统 调用 seek 


seek( ) 为 系统 调用 seek 的 处 理 函 数 ( 表 10-20， 代 码 清单 10-20 
) 。 该 函数 用 来 调整 文件 的 偏 移 量 ， 可 以 以 块 为 单位 (512 字 节 ) 对 偏 
移 量 进行 增 减 。 


首先 根据 文件 描述 符 获取 user,u_ofile[] 指向 的 file[] 元 素 ， 
然后 更 改 文件 偏 移 量 的 值 。 


表 10-20 系统 调用 seek 的 参数 


> 


牛 描述 符 


偏 移 量 的 增 减 值 。 单 位 为 字 节 或 块 《512 字 节 ) 


模式 。 指 定 偏 移 量 增 减 的 起 点 及 单位 〈 字 节 或 块 ) 。0、3 : 文件 的 起 
u.u_arg[1] | 始 位 置 。1、4 : 当前 偏 移 量 。2、5 : 文件 的 末尾 位 置 。0~2 时 以 字 节 
为 单位 ，3~5 时 以 块 为 单位 。0、3 时 偏 移 量 增 减 值 的 类 型 为 unsigned 


代码 清单 10-20 seek() (kenm/sys2.0) 


1 seek() 
2{ 
3 int n[2]; 
4 register *fp, t; 
5 
6 fp = getf(u.u_arO[RO]); 
7 if(fp == NULL) 
8 return; 
9 if(fp->f_flag&FPIPE) { 
10 U,U_error = ESPIPE,; 
11 return; 


13 t= Uu.u_arg[1]; 


14 if(t > 2) { 

15 n[1] = u.u_arg[0]<<9; 

16 n[9] = u.u_arg[0]>>7; 

17 if(t == 3) 

18 n[9] =& 0777; 

19 } else { 

20 n[1] = u.u_arg[90]; 

21 n[0] = 909; 

22 if(t!=0 && n[1]<0) 

23 n[9] = -1; 

24 

25 switch(t) { 

26 

27 case 1: 

28 case 4: 

29 n[9] =+ fp->f_offset[0]; 
30 dpadd(n, fp->f_offset[1]); 
31 break; 

32 

33 default: 

34 n[0] =+ fp->f_inode->i_size0&0377; 
35 dpadd(n, fp->f_inode->i_ sizel1); 
36 

37 case 0: 

38 case 3: 

39 

40 } 

41 fp->f_offset[1] = n[1]; 

42 fp->f_offset[0] = n[0]; 

43 } 


6~8 ”取得 与 文件 换 述 符 相 对 应 的 file[] 元 素 。 


9~12 ”无 法 调整 管道 的 偏 移 量 。 


14~18 ”如 琳 模 式 大 于 等 于 3， 则 将 仿 移 量 的 增 减 值 调 整 为 以 块 为 
单位 。 因 为 模式 为 3 时 偏 移 量 的 增 减 值 的 类 型 必须 为 unsigned， 所 
以 只 取出 数值 的 部 分 。 


19~24 ”如 琳 模 式 小 于 等 于 2， 偏 移 量 增 减 值 则 以 子 市 为 单位 。 但 
因为 模式 为 1、2 时 增 减 值 的 类 型 为 signed， 所 以 当 增 减 值 为 负数 
时 需要 将 n 的 高 位 字 n[9] 设置 为 -1， 使 n 全 体 都 为 负 值 。 


25 ”确定 新 的 文件 侦 移 量 
27~31 ”以 当前 的 文件 侦 移 量 为 基准 对 数值 进行 增 减 。 
33~35 ”以 文件 长 度 (文件 的 末尾 ) 为 基准 对 数值 进行 增 减 。 


37~39 ”因为 古 以 文件 的 起 始 位 置 为 基准 对 数值 进行 增 减 ， 所 以 不 
需要 进行 特别 处 理 。 


41~42 ”更 新 文件 偏 移 量 


10.6 ”关闭 文件 


系统 调用 close 


close( ) 是 系统 调用 close 的 处 理 函 数 〈 表 10-21， 代 码 清单 10- 
21) ， 用 来 关闭 文件 。 参 数 为 文件 描述 符 ， 系 统 调用 close 将 相应 的 

user .u_ofile[] 元 素 设 置 为 NULL ， 然后 执行 closef() ， 遂 减 

user .u_ofile[] 元 素 原 本 指向 的 filef[] 元 素 的 参照 计数 器 


表 10-21 系统 调用 close 的 参数 


1 

2 

3 register *fp; 

4 

5 fp = So u_arO[RO]); 

6 if(fp == NULL) 

7 return; 

8 U.U _ofileru， u_arO[RO]] = NULL; 
9 closef (fp); 


10 } 


closef() 


closef() 用 来 递减 file[] 元 素 的 参照 计数 器 的 值 ( 表 10-22， 代 码 
清单 10-22 ) 。 当 参照 计数 器 的 值 变 为 0 时 执行 closei( ) ， 递 减 
file[] 元 索 指 向 的 inode[] 元 素 的 参照 计数 妮 的 值 。 


表 10-22 closef0 的 参数 


Se 


代码 清单 10-22 closef() (ken/fio.c) 


1 closef(fp) 
2 int *fp; 
3 1 


register *rfp, *ip; 


rfp = fp; 
if(rfp->f_flag&FPIPE) { 
ip = rfp->f_inode; 
ip->i_mode =& ~(IREAD |IWRITE); 
wakeup(ip+1); 
wakeup(ip+2); 


} 
if(rfp->f_count <= 1) 

closei(rfp->f_inode, rfp->f_flag&FWRITE); 
rfp->f_count--; 


7~12 ”文件 为 管道 时 的 处 理 。 请 参考 第 11 章 。 


closeil() 


closei() 执行 iput() 递减 inode[] 元 素 的 参照 计数 器 的 值 (代码 
清单 10-23， 表 10-23 ) 。 文 件 为 特殊 文件 ， 且 当 参 照 计 数 圳 的 值 变 为 
0 时 进行 关闭 设备 的 处 理 。 


表 10-23 closei( 的 参数 


1 closei(ip, rw) 


register *rip; 
register dev, maj; 


rip = ip; 
dev = rip->i_addr[0]; 

maj = rip->i_addr[0].d_major; 
if(rip->i_count <= 1) 
switch(rip->i_ mode&IFMT) { 


case IFCHR: 
(*cdevsw[maj].d_close)(dev, 
break; 


case IFBLK: 
(*bdevsw[maj].d_close)(dev, 


iput(rip); 


10.7 目录 的 生成 


系统 调用 mknod 

mknod( ) 为 系统 调用 mknod 的 处 理 函 数 ( 表 10-24， 代 码 清单 10-24 
) ， 用 于 生成 目录 或 特殊 文件 。 该 系统 调用 只 有 超级 用 户 才能 执行 ， 
一 般 用 户 试图 执行 时 不 做 任何 处 理 并 引发 错误 。 


表 10-24 系统 调用 mknod 的 参数 


三 -机 inodei_mod 
设备 编号 。 被 赋予 inode.i_addr[0]。 生 成 目录 时 值 为 0 


代码 清单 10-24 mknod() (ken/sys2.0) 


1 

2 

3 register *ip; 

4 extern uchar; 

5 

6 if(suser()) { 

7 ip = namei(&uchar, 1); 
8 if(ip != NULL) { 

9 U,.U_error = EEXIST; 
10 goto out; 

11 

12 } 

13 if(u.u_error) 

14 return; 

15 ip = maknode(u.u_arg[1]); 
16 if (ip==NULL) 

17 return; 


18 ip->i_addr[0] = u.u_arg[2]; 


21 ‘iput (ip); 
} 


6 ”超级 用 户 时 的 处 理 。 为 了 使 一 般 用 户 也 可 以 生成 日 录 ， 有 的 系 
统 会 对 生成 目录 的 命令 mkdir 设置 SUID 标志 位 。 


7~11 ”利用 namei() 取得 与 用 户 指定 的 路 径 名 相对 应 的 
inode[] 元 素 。 因 为 准备 生成 新 的 文件 或 目录 ， 所 以 如 果 与 路 径 
名 相对 应 的 inode[] 元 素 已 经 存在 ， 则 进行 错误 处 理 。 


13~14 ”如 果 当 前 用 户 不 是 超级 用 户 ，suser( ) 则 会 将 错误 代码 
赋予 u,uU_error。 另 外 , 在 namei() 中 出 错时 也 会 将 错误 代码 


赋予 u.uU_error。 

15~17 ”执行 maknode() 生成 新 的 文件 。 

18 将 inode.i addr[9] 设置 为 用 户 通过 参数 指定 的 值 。 

21 生成 文件 或 执行 namei( ) 时 会 递增 inode[] 元 素 的 参照 计 
数 绩 的 值 ， 此 处 则 进行 递减 。 


10.8 ”文件 的 链接 


链接 用 于 实现 所 谓 的 “ 硬 链 接 * (hard link) ， 在 UNIX V6 中 没有 符号 
链接 的 概念 。 


通过 链接 可 以 对 一 个 文件 (inode + 存储 区 域 的 块 ) 赋予 多 个 名 称 。 例 
如 ， 对 名 为 /var/hoge 的 文件 设 定名 为 /varhomnu 的 链接 后 ， 就 可 以 通 
过 /var/hoge 或 /var/homu 的 路 径 名 访问 同一 个 文件 。 


渐 旧 名 称 具 有 相同 的 作用 。 即 使 删除 了 /var/hoge，/var/homu 仍旧 处 于 
可 参照 的 状态 ， 因 此 文件 本 身 不 会 被 删除 。 文 件 具 有 的 @ 称 的 数量 称 

为 被 链接 数 ,由 ijnode .i_nlink 管理 ,只 要 被 链接 数 的 值 不 为 0, 文 件 就 
不 会 被 删除 。 


与 此 相反 ， 如 果 是 符号 链接 ， 当 删除 原本 的 名 称 ”varhoge” 时 ， 文 件 本 
身 也 会 被 删除 。 符 号 链接 具有 主 从 关系 ， 链 接 (从 ) 可 以 被 看 做 仅仅 
征 指向 原 有 的 文件 ( 主 ) 。 


硬 链 接 存在 若干 问题 。 首 要 问题 是 无 法 跨 设 备 设 定 链接 。 目 孙 的 对 应 
表 只 记录 了 inode 编号 和 文件 名 的 信息 ， 只 通过 inode 编写 无 法 判断 该 
inode 属于 哪个 设备 。 


除 此 之 外 ， 无 法 对 目录 设 定 链接 也 是 问题 之 一 。 这 会 使 命名 空间 中 出 
0 ° 为 了 解决 上 述 问 题 ， 导 入 了 符号 链 
女 昌 人 re ° 


在 UNIX V6 中 ， 超 级 用 户 可 以 对 目录 设 定 链接 。 出 于 安全 性 的 考虑 ， 
最 近 的 一 些 操作 系统 开始 限制 超级 用 户 设 定 目 录 的 链接 。 


系统 调用 link 


link( ) 为 系统 调用 1ink 的 处 理 函 数 ( 表 10-25， 代 码 清单 10-25 

) ， 用 于 设 定 链接 。 如 果 被 链接 的 文件 不 存在 ， 或 与 新 赋予 的 路 径 名 
相对 应 的 文件 已 经 存在 时 将 引发 错误 。 此 外 ， 被 链接 数 的 上 限 为 127， 
超过 此 数值 时 也 会 引发 错误 。 


表 10-25 系统 调用 link 的 参数 


被 链接 的 文件 的 路 径 名 


代码 清单 10-25 link() (kem/sys2.0) 


ink() 


register *ip, *xp; 


11 
2 { 
3 

4 extern uchar; 


5 
6 ip = namei(&uchar, 0); 
7 if(ip == NULL) 

8 


return; 

9 if(ip->i nlink >= 127) { 
10 u.u_error = EMLINK; 
11 goto out; 

12 六 

13 if((ip->i_ mode&IFMT)==IFDIR && !suser()) 
14 goto out; 

15 ip->i_flag =& ~ILOCK; 
16 u.u_dirp = u.u_arg[1]; 
17 xp = namei(&uchar, 1); 
18 if(xp != NULL) { 

19 u.u_error = EEXIST; 
<9 iput (xp); 

21 

22 if(u.u_error) 

23 goto out; 

24 if(u.u_pdir->i dev != ip->i dev) { 
25 iput(u.u_pdir); 

26 u.u_error = EXDEV; 
27 goto out ; 

28 | 

29 wdir (ip); 

30 ip->i_nlink++; 

31 ip->i_flag =| IUPD; 

32 

33 out: 

34 iput (ip); 

35 } 


6~8 ”取得 与 被 链接 文件 的 路 径 名 相对 应 的 inode[] 元 素 。 
9~12 ”如 来 超过 链接 数 的 上 限 则 引发 销 误 。 


13~14 ”如 果 是 日 录 ， 只 有 超级 用 户 才 可 以 设 定 链接 。 


15 ”解锁 获取 的 inode[] 元 素 。 在 namei( ) 调用 的 ijget() 中 
对 该 元 素 加 锁 。 


16~21 ”和 芝 试 取得 与 用 户 通过 参数 指定 的 第 2 个 路 径 名 相对 应 的 
inode[] 元 素 。 因 为 希望 用 该 路 径 设 定 链接 ， 所 以 如 果 取 得 了 与 


inodef[] 元 素 〈 即 已 经 存在 同名 的 文件 ) 则 引发 
背 误 。 

22~23 ” 当 namei() 中 发 生 错误 ， 或 是 取得 了 inode[] 元 素 
时 ，u,u_error 将 被 赋予 销 误 代 码 。 


24~28 ”在 不 同 的 设备 之 间 无 法 设 定 链接 。 在 第 17 行 执行 的 
namei() 中 ， 第 2 个 路 径 名 所 指向 的 文件 的 父 目 录 被 赋予 


u.u_pdir 。 


29 ”将 与 第 1 个 路 径 名 相对 应 的 inode[] 元 素 ， 追 加 至 由 第 2 
个 路 径 名 指向 的 文件 父 目录 的 对 应 表 中 。 由 于 在 第 17 行 执行 的 
namei( ) 中 已 将 与 第 2 个 路 径 名 相对 应 的 文件 名 赋予 了 
u.u_dent ， 因 此 对 应 表 记 录 中 的 文件 名 是 与 第 2 个 路 径 名 相对 
应 的 文件 名 。 


30~31 ”递增 与 被 链接 文件 相对 应 的 inode[ ] 元 素 的 家 链接 数 ， 
并 设置 inode[ ] 元 系 的 更 新 标志 位 。 


34 “递减 由 namei( ) 中 的 ijget() 递增 的 inodef[] 元 素 的 参照 
计数 器 的 值 。 


suser() 


suser() 检查 执行 进程 是 否 由 超级 用 户 执行 (代码 清单 10-26 ) 。 如 
果 执 行者 为 超级 用 户 ，user .u_uid 则 为 0。 


代码 清单 10-26 suser() (ken/fio.c) 


1 suser() 

2 

3 

4 if(u.u_uid == 0) 

5 return(1); 

6 U,.U_error = EPERM; 
7 return(0); 

8 } 


10.9 ”删除 文件 
系统 调用 unlink 


unlink( ) 为 系统 调用 unlink 的 处 理 函 数 〈 表 10-27， 代 码 清单 10- 
27 ) ， 用 来 删除 文件 。 目 录 只 有 超级 用 户 才 能 删除 。 

删除 文件 是 通过 将 目录 对 应 表 相 应 记录 中 的 inode 编号 设置 为 0 得 以 实 
现 的 。 删 除 某 个 目录 下 名 为 “hoge.txt”* 的 文件 时 的 例子 如 表 10-26 所 

ma O 


表 10-26 文件 删除 


此 外 ， 系 统 调用 unlink 将 递减 jnode.i_nlink。 当 

inode .i_nlink 的 值 变 为 0 时 ， 该 inode 以 及 所 使 用 的 存 取 区 域 将 被 
释放 。 人 但是， 存储 区 域 中 保存 的 数据 将 维持 原状 直到 被 其 他 数据 履 

盖 。 删 除 文件 可 看 做 是 消除 了 访问 存储 区 域 的 途径 。 


表 10-27 系统 调用 unlink 的 参数 


u.u_arg[9] 准备 删除 的 文件 的 路 径 名 


代码 清单 10-27 unlink() (ken/sys4.c) 


unlink() 

{ 
register *ip, *pp; 
extern uchar; 


pp = namei(&uchar, 2); 
if(pp == NULL) 
return; 
prele(pp); 
ip = iget(pp->i_dev, u.u_dent.u_ino); 
if(ip == NULL) 
panic("unlink -- iget"),; 
if((ip->i_ mode&IFMT)==IFDIR && !suser()) 
goto out ; 
.U_offset[1] =- DIRSIZ+2; 
.U_base = &u.u_dent; 
.U_count = DIRSIZ+2 ， 
uU.u_dent.u_ino = 0; 
writei(pp); 
ip->i_nlink--; 
ip->i_flag =| IUPD; 


iput (pp); 
iput(ip); 


6~8 将 namei() 的 第 2 个 参数 设 定 为 2， 获 取 与 准备 删除 的 文 
件 的 父 目 录 相 对 应 的 inode[] 元 素 。 


9 


该 元 素 已 由 namei( ) 加 锁 ， 此 处 对 其 解锁 。 


10~12 ”取得 与 路 径 名 相对 应 的 inode[] 元 素 。 
U.u_dent.u_ino 已 由 namei() 进行 了 设 定 。 


13~14 ”如 果 不 是 超级 用 户 则 无 法 删除 目录 。 但 是 ， 也 存在 其 他 
UNIX 版 本 ， 为 删除 目录 的 命令 rmdir 设 定 SUID 位 ， 使 得 一 般 
用 户 也 可 以 删除 目录 。 


15~19 ”执行 writei()， 修 改 目 录 对 应 表 。u.u_dent 和 
u.u_offset 已 由 namei() 进行 了 设 定 。 因 为 

uU,.U_dent.u_ ino 的 值 为 0， 对 应 表 中 相应 记录 的 inode 编号 也 
将 变 为 0。 


20~21 递减 inode[] 元 素 的 被 链接 数 ， 并 设置 更 新 标志 位 。 


24~25 ”递减 与 父 目录 和 被 删除 文件 相对 应 的 inode[] 元 素 的 参 
照 计数 右 的 值 。 


10.10 小结 


已 打开 的 文件 由 user.u_ofile[] 、file[] 、inode[]3 个 
结构 体 管理 。 


文件 打开 后 ，user .u_ofile[] 的 数组 下 标 ， 即 文件 描述 符 被 返 
还 给 用 户 程序 。 


file[] 用 来 管理 文件 偏 移 量 等 操作 文件 的 数据 。 

read 和 write 的 处 理 以 块 为 单位 进行 。 

删除 文件 等 同 于 将 目录 对 应 表 的 相应 记录 的 inode 编号 设置 为 0。 
通过 链接 可 以 为 文件 设 定 多 个 名 称 。 


第 11 章 管道 
11.1 什么 是 管道 


管道 是 在 父 进程 和 子 进程 之 间 通 信 的 机 制 。 因 为 进程 拥有 各 自 独 立 的 
虚拟 地 址 空间 ， 所 以 任意 的 进程 是 无 法 直接 访问 其 他 进程 拥有 的 数据 
的 。 为 了 实现 进程 间 的 通信 ， 于 是 设计 了 管道 。 


管道 对 文件 系统 (的 一 部 分 ) 进行 了 巧妙 应 用 ， 使 得 进程 间 的 通信 成 
为 可 能 。 管 道 首先 获取 根 人 磁极 的 inode， 然 后 利用 该 inode 指向 的 存储 
区 域 进行 数据 交换 。 这 个 文件 (inode 和 存储 区 域 ) 构成 了 管道 的 实体 
， 管道 的 容量 由 PIPSIZ 定义 ， 缺 省 值 为 4096 字 节 (代码 清单 11-1 


代码 清单 11-1 PIPSIZ (ken/pipe.c) 


1 #define PIPSIZ 4096 


利用 管道 进行 的 通信 流程 如 下 所 示 (图 11-1) 。 
1. 发 送 方 的 进程 向 管道 写 入 数据 ， 直 到 管道 被 充满 。 


2. 切换 至 接收 方 的 进程 ， 使 得 从 管道 读 入 数据 。 已 经 接收 的 数据 从 管 
道中 被 删除 。 


3. 数据 全 部 读 取 后 ， 切 换 至 发 送 方 的 进程 ， 返 回 1. 的 处 理 。 


发 送 方 以 与 管道 相对 应 的 jnode[] 元 素 的 地 址 +1、 接 收 方 以 该 地 址 
+2 为 参数 执行 sleep()。 


管道 
(Ip=&inode) 
INode.l_size | 
write() 全 ! read() 
人 
| v 
sleep(ip+1) 4 一 inode.i_size Sleepl(lip+2) 
swtch!() 
图 11-1 管道 
使 用 管道 的 优点 


在 进程 间 传 递 数 据 也 可 通过 临时 文件 来 实现 (代码 清单 11-2) 。 
代码 清单 11-2 ”临时 文件 


1 % ./sender > tmp 
2 % ./receiver < tmp 


与 临时 文件 相 比 ， 使 用 管道 具有 下 壕 优点 。 首 先 ， 可 使 用 的 块 设备 的 
资源 是 有 限 的 。 管 道 的 容量 为 固定 的 4096 字 节 ， 因 此 即使 用 来 交换 更 
大 容量 的 数据 也 不 会 占用 更 多 的 块 设 备 区 域 。 而 使 用 临时 文件 时 ， 会 
占用 与 所 交换 的 数据 相等 容量 的 块 设备 区 域 。 


其 次 ， 管 道 所 需要 的 缓冲 区 的 容量 小 于 缓冲 区 的 总 容量 ， 利 于 发 挥 块 
设备 缓冲 区 的 缓存 功能 。 而 且 ， 当 发 送 方 的 进程 将 数据 写 入 管道 后 ， 
接收 方 的 进程 将 马上 进行 谈 取 ， 块 设备 的 缓存 效 末 会 更 加 明显 。 


与 之 相反 ， 当 使 用 临时 文件 时 ， 如 果 需 要 输出 大 于 块 设备 缓冲 区 容量 
的 文件 ， 缓 冲 区 所 珊 来 的 缓存 效 琳 将 因此 受到 影响 。 


但 是 ， 当 使 用 管道 ， 且 执行 进程 由 发 送 方 切换 至 接收 方 时 ， 如 果 存 在 
执行 优先 级 更 高 的 进程 ， 且 该 进程 也 使 用 了 块 设备 的 缓冲 区 时 ， 则 无 


法 期 待 缓冲 区 带 来 的 缓存 效果 。 此 时 ， 性 能 虽然 并 未 得 到 改善 ， 但 是 
由 于 数据 已 输出 至 块 设备 ,因此 对 通信 内 容 本 身 不 会 造成 影响 。 


管 站 基于 现 有 的 文件 系统 ， 实 现 的 成 本 较 低 。 尽 管 占用 的 货源 较 少 ， 
却 实现 了 进程 间 的 高 速 通信 。 低 投入 高 产 出 可 视 作 管道 最 大 的 魅力 。 


11.2 ”开始 管道 通信 


系统 调用 pipe 


pipe 用 来 建立 管道 通信 ，pipe( ) 为 其 处 理 函 数 (代码 清单 
11-3) 。 


首先 在 user .u_ofile[] 和 file[] 中 分 配 供 read 和 write 使 用 
的 元 素 ， 然 后 获取 根 磁盘 的 jnode[] 元 素 ， 将 供 read 和 write 使 
用 的 file[] 元 素 指 向 该 jnode[] 元 素 。 为 file[] 元 素 设置 表示 

管道 的 FPIPE 标志 位 (图 11-2) 。 


u.u_ofile[] filel] inodel] 


| 


图 11-2 pipe0 


read 和 write 使 用 的 文件 描述 符 返 还 给 用 户 程序 。 用 户 程序 对 待 该 
文件 描述 符 ， 可 以 像 对 待 一 般 文件 一 样 进行 读 写 ， 实 现 管道 通信 。 


代码 清单 11-3 pipe0 (ken/pipe.c) 


pipe() 
{ 


register *ip, *rf, *wf; 
int r; 


ip = ialloc(rootdev); 

if(ip == NULL) 
return; 

rf = falloc(); 

if(rf == NULL) { 
iput(ip); 
return; 

} 

r= u.u_ aroO[RO]; 

wf = falloc(); 

if(wf == NULL) { 
rf->f_count = 0; 
u.u_ofile[r] = NULL， 
iput(ip); 
return; 


uU.Uu_arO[R1] uU.u_arQO[RO]; 
u.Uu_arQO[RO] r; 
wf->f_flag = FWRITE|FPIPE， 
wf->f_inode = ip; 

rf->f flag = FREAD|FPIPE; 
rf->f_inode = ip; 
ip->i_count = 2; 
ip->i _ flag = IACC|IUPD; 
ip->i_mode IALLOC ; 


6~8 ”从 根 人 磁盘 的 inode[ ] 获取 新 的 元 素 。 


9~14 在 user.u_ofile[] 和 file[] 中 分 配 供 read 使 用 的 
元 素 。falloc( ) 中 将 所 取得 user .u_ofile[] 元 素 的 数组 下 


标 (文件 描述 符 ) 赋予 u,u_arg[R9] ， 此 处 再 将 其 保存 在 局 部 


变量 r 中 。 

15~23 ” 同样， 在 user.u_ofile[] 和 file[] 中 分 配 供 
write 使 用 的 元 素 。 用 户 进程 的 r1 中 保存 了 供 write 使 用 的 文 
件 描 述 符 ，rg 中 保存 了 供 read 使 用 的 文件 描述 符 。 这 两 个 值 将 
被 返回 给 用 户 程序 。 


24~30 “对 取得 的 元 素 进 行 初 始 化 。 为 供 read 使 用 的 file[] 元 
素 设 置 FREAD 、FPIPE 标志 位 ， 为 供 write 使 用 的 file[] 元 
素 设 置 FWRITE 、FPIPE 标志 位 。 无 论 是 read 还 是 write 使 用 
的 file[] 元素， 都 使 其 指向 之 前 取得 的 根 人 磁盘 的 inode[] 元 
素 。 将 inodef[] 元 素 的 参照 计数 器 的 值 设 定 为 2 ， 并 设置 参照 标 
志 位 和 更 新 标志 位 ， 最 后 将 inode .i _mode 设置 为 IALLOC 。 


11.3 ”收发 数据 


对 通过 系统 调用 pipe 取得 的 文件 描述 符 ， 可 以 像 对 竺 一般 文件 那样 
read 和 write ， 从 而 实现 数据 收发 (代码 清单 11-4 


代码 清单 11-4 _ rdwr0 中 的 相关 代码 (ken/sys2.c) 


13 uU.u_base = u.u_arg[0]; 


14 U.Uu_count = u.u_arg[1]; 

15 u.u_segflg = 0; 

16 if(fp->f_flag&FPIPE) { 

17 if (m==FREAD) 

18 readp(fp); else 

19 writep(fp); 

20 } else { 

21 u.u_offset[1] = fp->f_offset[1]; 
22 u.u_offset[0] = fp->f_offset[0]; 
23 if(m==FREAD ) 

24 readi(fp->f_inode); else 

25 writei(fp->f_inode); 

26 dpadd(fp->f_offset, u.u_arg[1]-u.u_count); 
27 


} 
28 U.Uu_arQO[RO] = u.u_arg[1]-u.u_count; 


| 


16~19 ” 当 设 置 了 file[] 元 素 的 FPIPE 标志 位 时 ， 在 rdwr() 
中 将 执行 writep() 和 readp()。 


writep() 

writep() 用 来 对 管道 进行 写 入 处 理 ( 表 11-1， 代 码 清单 11-5 ) 。 
为 管道 的 实体 为 文件 ， 所 以 采用 与 对 待 一 般 文件 相同 的 方式 调用 
writei() 写 入 数据 。 当 管道 被 充满 (4096 字 节 ) 时 进入 睡眠 状态 。 
如 果 存 在 等 待 管道 被 写 入 数据 的 进程 ， 则 将 其 唤醒 。 


但 是 ， 与 一 般 文 件 处 理 不 同 ,文件 偏 移 量 (file.f_offset ) 不 会 发 
生变 化 (图 11-3) 。 


管道 ( 实体 为 文件 ) 


inode.l_size 一 -> 国 国 
file.f_offset 一 一 


图 11-3 writep0 
表 11-1 writep0 的 参数 


代码 清单 11-5 writep0 (ken/pipe.c) 


ritep(fp) 


1w 
2 人 
3 register *rp, *ip, c; 
4 


5 rp = fp; 

6 ip = rp->f_inode; 

7 c= U.U_count， 

8 

9 loop: 
10 plock(ip); 
11 if(c == 0) { 
12 prele(ip); 
13 U,.U_Ccount = 0; 
14 return; 
15 
16 if(ip->i count < 2) { 
17 prele(ip); 
18 U,.U_error = EPIPE; 
19 psignal(u.u_procp, SIGPIPE); 
20 return; 
21 
22 if(ip->i size1 == PIPSIZ) { 
23 ip->i_mode =| IWRITE; 
24 prele(ip); 

25 sleep(ip+1, PPIPE); 

26 goto loop; 

27 } 

28 u.u_offset[0] = 0; 

29 u.u_offset[1] = ip->i sizel; 
30 U,.U_count = min(c，PIPSIZ-uU.U_off set[1]); 
31 C =- U.U_count; 

32 writei(ip); 

33 prele(ip); 

34 if(ip->i mode&IREAD) { 

35 ip->i_mode =& ~IREAD; 
36 wakeup(ip+2); 

37 

38 goto loop; 

39 } 


10 ”加 锁 ijnode[] 元 素 。 


11~15 ” 当 数 据 输 出 完毕 后 为 jnode[] 元 素 解 锁 。 将 
U,U_count 清 0 并 返回 。 


16~21 ”如 采 接 收 方 的 管道 被 关 财 ，inode[] 元 系 的 参照 计数 大 
的 值 将 小 于 2。 这 会 造成 数据 无 法 被 发 送 ， 因 此 进行 出 错 处 理 。 为 
inode[] 元 素 解锁 ， 并 癌 目 身 发 送信 号 。 


22~27 ”如 果 管 道 被 充满 ， 则 为 inode[ ] 元 素 设 置 IWRITE 标志 
位 ， 并 为 jnode[] 元 素 解 锁 ， 然 后 进入 睡眠 状态 等 待 资源 ip+1 
。 在 管道 处 理 中 ，IWRITE 标志 位 表示 管道 已 被 充满 ， 发 送 方 正在 
等 竺 数据 被 使 用 。 在 被 接收 方 唤醒 之 后 ， 发 送 方 将 返回 Loop ， 
继续 向 管道 写 入 数据 。 


28~31 将 u.u_offset 设 定 为 当前 的 文件 长 度 ， 将 
uU,U_count 设 定 为 小 于 管道 容量 (4096 字 节 ) 的 值 。 局 部 变量 c 
中 保存 着 准备 写 入 的 数据 的 剩余 字 节 数 。 

32 ”执行 writei() 写 入 数据 。 

33 ”为 jnode[] 元 素 解 锁 。 


34~37 ”如 果 设 置 了 inodef[] 元 素 的 IREAD 标志 位 ， 则 将 其 清 
除 然后 唤醒 接收 方 的 进程 。 


38 ”返回 1oop ， 继 续 向 管道 写 入 数据 的 处 理 。 


readp() 


readp( ) 从 管道 读 取 数据 ( 表 11-2， 代 码 清单 11.6 ) 。 因 为 管道 的 实 
体 为 文件 ， 所 以 采用 与 对 待 一 般 文件 相同 的 方式 调用 readi ( ) 读 取 数 
据 。 当 管道 变 空 时 进入 睡眠 状态 。 如 果 存 在 因 管道 被 充满 而 等 待 其 他 
读 取 数 据 的 进程 ， 则 将 其 唤醒 。 


文件 偏 移 量 将 随 着 从 管道 中 读 取 的 数据 增 大 ， 当 偏 移 量 与 文件 长 度 同 
值 时 ， 文 件 长 度 与 文件 指针 都 将 归 0 (图 11-4) 。 


Inode.|_SIZe 一 -> 全 


file.f_offset 一 一 > 
二 


Inode.1_Size 


file.f_offset ) 


INode.l_size | 
file.f_offset 


图 11-4 readp() 
表 11-2 readp(0 的 参数 


代码 清单 11-6 readp() (ken/pipe.c) 


1 readp(fp) 
int *fp; 


2 
34{ 
4 
5 
6 
7 
8 
9 


loop: 


register *rp, *ip; 


fp; 


rp ; 
rp->f_inode; 


ip 


10 plock(ip); 


11 if(rp->f_offset[1] == ip->i Size1) { 
12 if(rp->f_offset[1] != 0) { 
13 rp->f_offset[1] = 0; 

14 ip->i_ Size1 = 0; 

15 if(ip->i_mode&IWRITE) { 
16 ip->i_mode =& ~IWRITE; 
17 wakeup(ip+1); 

18 } 

19 } 

20 prele(ip); 

21 if(ip->i_ count < 2) 

22 return; 

23 ip->i_mode =| IREAD; 

24 sleep(ip+2, PPIPE); 

25 goto loop; 

26 } 

27 u.u_offset[0] = 9; 

28 u.u_offset[1] = rp->f_offset[1]; 
29 readi(ip); 

30 rp->f_offset[1] = u.u_offset[1]; 
31 prele(ip); 

32 } 


10 ”加 锁 ijnode[] 元 素 。 


11 ”如 采 已 读 取 了 管道 中 的 全 部 数据 ， 则 进入 睡眠 状态 以 便 发 送 
方 传送 更 多 的 数据 。 


12 ” 读 取 了 寿 干 数据 后 的 处 理 。 
13~14 ”对 已 读 取 的 数据 ， 将 文件 偏 移 量 和 文件 长 度 清 0。 


15~18 ”如 果 设 置 了 IWRITE 标志 位 ， 则 将 其 清 0， 唤 醒 发 送 方 的 
进程 。 


20 ”解锁 ijnode[] 元 素 。 


21~22 ” 当 发 送 方 的 进程 关闭 了 管道 时 ，inode[] 元 素 的 参照 计 
数 器 的 值 将 小 于 2， 此 时 结束 管道 处 理 。 


23~25 为 inode[] 元 素 设置 TIREAD 标志 位 并 进入 睡眠 状态 。 
在 管道 处 理 中 ，IREAD 标志 位 表示 管道 已 空 ， 数 据 的 接收 方正 在 
等 得 更 多 的 数据 。 当 接收 方 被 发 送 方 的 进程 唤醒 后 ， 将 返回 loop 
继续 读 取 处 理 。 


27~29 ” 设 定 偏 移 量 ， 然 后 执行 readi( ) 读 取 数据 。 
30 ” 当 数 据 读 取 完 毕 后 更 新 文件 偏 移 量 
31 解锁 inode[] 元 素 。 
plock() 
plock() 用 于 对 inode[] 元 素 进行 加 锁 处 理 〈 表 11-3， 代 码 清单 11- 


7 ) 。 该 函数 为 jnode[] 元 素 设置 TILOCK 标志 位 。 如 果 已 设置 了 该 
标志 位 ， 则 为 jnode[ 1] 元 素 设置 IWANT 标志 位 并 进入 睡眠 状态 。 


表 11-3 plock0 的 参数 


本 


代码 清单 11-7 plock0 (ken/pipe.c) 


1 plock(ip) 
2 int *ip; 
3 1 
4 register *rp; 
5 
6 rp = ip; 
7 while(rp->i flag&ILOCK) { 
8 rp->i_flag =| IWANT; 
9 sleep(rp, PPIPE); 
10 
11 rp->i_flag =| ILOCK; 


| 


prele() 


prele( ) 用 于 清除 inode | ] 元 素 的 ILOCK 标志 位 并 为 其 解锁 ( 表 
11-4， 代码 清音 11-8 ) 。 当 设置 了 IWANT 标志 位 时 则 将 其 清除 ， 并 唤 
醒 其 他 正在 等 待 该 inode [ ] 元 素 的 锁 被 释放 的 进程 。 


表 11-4 prele( 的 参数 


代码 清单 11-8 prele() (kenm/pipe.c) 


prele(ip) 
int *ip; 
{ 


register *rp; 


rp = ip; 
rp->i_flag =& ~ILOCK; 


if(rp->i_flag&IWANT) 区 
rp->i_flag =& ~IWANT; 
wakeup (rp); 


11.4 ”结束 管道 通信 


closef() 


当 管 道 通信 结束 后 ， 用 户 程序 对 通过 系统 调用 pipe 取得 的 文件 描述 
符 ， 像 对 待 一 般 文件 一 样 执行 系统 调用 close 来 关闭 管道 。 


如 果 设 置 了 filef[] 元 素 的 FPIPE 标志 位 ， 则 在 closef() 中 为 
file[] 元 素 指 疝 的 Inode[] 元 素 清除 IREAD 和 IWRITE 标志 位 ， 
并 唤醒 发 送 方 和 接收 方 的 进程 。 通 信 的 双方 此 时 都 处 于 睡眠 状态 ， 等 
竺 对 方 进行 读 写 ， 如 果 对 方 的 进程 就 这 样 结束 处 理 ， 睡 眠 中 的 进程 就 
无 法 被 唤醒 ， 因 此 要 在 此 处 进行 唤醒 处 理 (代码 清单 11-9) 。 


此 后 的 处 理 流程 与 关闭 一 般 文件 相同 。 
代码 清单 11-9 ”closef 的 相关 处 理 (ken/fio.c) 


if(rfp->f_flag&FPIPE) { 
ip = rfp->f_inode; 
ip->i_mode =& ~(IREAD |IWRITE); 
wakeup(ip+1); 
wakeup(ip+2); 


} 
if(rfp->f_count <= 1) 

closei(rfp->f_inode, rfp->f_flag&FWRITE); 
rfp->f_count--; 


11.5 ”建立 管道 通信 的 流程 
建立 父子 进程 间 的 通信 


本 节 介 绍 在 父子 进程 间 建 立 管道 通信 的 流程 ， 此 处 需要 用 到 系统 调用 
pipe 、 系 统 调 用 fork 以 及 系统 调用 close 。 


在 系统 调用 pipe 执行 结束 后 ， 再 执行 系统 调用 fork ， 父 进程 的 
user .u_ofile[] 的 内 容 将 被 复制 到 新 生成 的 子 进程 中 。 如 果 利 用 系 
统 调 用 close 关闭 与 父 进程 的 read 使 用 的 文件 描述 符 ， 和 与 子 进程 
的 write 使 用 的 文件 描述 符 相 对 应 的 user,.u_ofile[] 元 素 ， 束 形 
成 了 一 条 从 父 到 子 传送 数据 的 管道 (图 11-5) 。 


进程 1 


User.u_ofilel] file[] inodel] 
2 
Jy 系统 调用 fork 
进程 1 
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J 系统 调用 close 


进程 1 
user.u_ofilel[] file[] inodel] 


图 11-5 pipe 、 fork 、 close 


再 加 上 系统 调用 dup ， 束 可 以 实现 在 Shell 中 使 用 的 通过 个 连接 的 管 
道 通 信 (代码 清单 11-10 ) 。 此 例 中 ，ls 向 标准 输出 写 入 数据 ， 而 
cat 从 标准 输入 中 取得 数据 ， 通 过 这 种 和 商 单 的 方式 即 可 实现 数据 的 交 
换 。 


代码 清单 11-10 管道 通信 


1% ls | cat 


进程 的 user.u_oflie[0] 、user.u_oflie[1] 和 

user .u_oflie[2] 中 分 别 保 存 了 与 标准 输入 (stdin ) 、 标 准 输 出 
(stdout ) 和 标准 错误 输出 (stderr ) 相对 应 的 文件 描述 符 。 程 序 

在 对 标准 输入 、 标 准 输出 和 标准 错误 输出 进行 读 写 时 ， 需 要 使 用 系统 

调用 read 和 write 。 上 壕 的 管道 通信 通过 将 标准 输入 和 标准 输出 改 

为 管道 得 以 实现 。 


在 执行 系统 调用 pipe 和 fork 之 后 ， 通 过 系统 调用 close 关闭 父 进 
程 的 标准 输出 (=user .u_ofile[1] ) 和 子 进程 的 标准 输入 

(=user.u_ofile[0] ) 。 此 后 ,执行 系统 调用 dup 复制 与 write 
和 read 使 用 的 文件 描述 符 相 对 应 的 user .,u_ofile[] 元 素 。 因 为 系 
统 调 用 dup 将 文件 描述 符 复制 到 user .u_ofile[] 中 排 在 最 前 面 的 
空闲 元 素 处 ， 所 以 write 和 read 使 用 的 文件 描述 符 将 被 复制 到 刚才 
关闭 的 user .u_ofile[] 元 素 的 位 置 。 


最 后 ， 关 闭 由 系统 调用 pipe 生成 的 与 write 和 read 使 用 的 文件 摘 
user .u_ofile[] 元 素 ， 结 束 建立 管道 通信 的 处 理 
(图 11-6 ) 。 


进程 1 - 
USer.u_ofilel[l] file[l] inNEdel[] 


USer.u_ofilel] 


Ee J 系统 调用 close 


进程 1 _ 
USer.u_ofile[l] filel[l] inNOEdel] 


USer.u_ofilel] 


| 
ee 
filel] 


进程 1 


USser.u_ofilel[l] 


iNOEOdel] 


= 
LL = 
Ti 
| 
| 
| 
进程 2 | 
| 
TS 
| 


二 系统 调用 close 
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图 11-6 ”pipe、fork、close、dup、close 


系统 调用 dup 


dup( ) 为 系统 调用 dup 的 处 理 画 数 ( 表 11-5， 代 码 清单 11-11 ) 。 系 
统 调 用 dup 将 与 用 户 程序 指定 的 文件 摘 述 符 相 对 应 的 

user .u_ofile[] 元 素 复制 到 user,u_ofilefr] 中 排 在 最 前 面 的 空 
内 元 素 处 (图 11-7) 。 


USer.U_ofilel file[] 


user.yu_ofilel] file[] 


复制 


图 11-7 系统 调用 dup 


表 11-5 系统 调用 dup 的 参数 


准备 复制 的 u.u_ofile[] 元 素 相 对 应 的 文件 


register i, *fp; 


fp = getf(u.u_arO[RO]); 
if(fp == NULL) 
return; 
if ((i = ufalloc()) < 0) 
return; 
u.u_ofile[i] = fp; 
fp->f_count++; 


5~7 ”取得 与 用 户 程序 通过 参数 指定 的 文件 描述 符 相 对 应 的 
file[] 元 素 。 


8~9 ”取得 u.u_ofile[] 中 排 在 最 前 面 的 空 内 元 素 。 

10~11 ”将 获取 的 u.,u_ofile[] 元 素 指向 在 第 5 行 中 获取 的 

file[] 元 素 ， 并 递增 file[] 元 素 的 参照 计数 器 的 值 。 
11.6 ”小结 

。 利用 管道 可 以 实现 父子 进程 间 的 通信 。 


。 发 送 方 进程 和 接收 方 进 程 交替 对 长 度 为 4096 字 厄 的 管道 (文件 ) 
进行 读 写 。 


ll 


。 结合 系统 调用 pipe、fork 、close、dup ， 建 立 管道 通信 。 


第 VI 部 分 字符 WO 系统 


字符 IO 设备 以 文字 为 单位 处 理 数 据 ,在 行 打印 机 和 终端 等 直接 被 用 户 
使 用 的 外 部 设备 中 经 常用 到 。 第 VI 部 分 主要 介绍 以 下 内 容 。 


。 字符 设备 如 何 与 系统 进行 数据 交换 
。 字符 设备 驱动 如 何 对 字符 设备 进行 操作 
。 内 核 如 何 对 终端 处 理 提 供 文 持 
通过 阅读 本 部 分 的 内 容 ,读者 会 了 解 用 户 和 系统 是 如 何 发 生 关 联 的。 


第 12 章 字符 设备 
12.1 字符 设备 驱动 


与 块 设备 驱动 相同 ， 了 字符 设备 也 存在 相应 的 设备 续 动 表 。cdevsw[] 
为 字符 设备 驱动 表 (代码 清单 12-1, 表 12-1) 。 


字符 设备 利用 缓冲 区 处 理 数 据 (图 12-1) 。 


缓冲 区 池 
UN A 
We 
和 
\ 


cdevsw!l] 


图 12-1 字符 设备 驱动 表 
代码 清单 12-1 cdevsw[] (conf.h) 


truct cdevsw 


int *d_open) 
int *d_close 
int *d _read ) 


int 
int 
} cdevsw[ ]; 


表 12-1 cdevsw 结构 体 


指向 用 于 打开 设备 的 函数 的 指针 


于 关闭 设备 的 函数 的 指针 


(*d_close)() 
(*d_read)() 
(*d_write)() 


(*d_sgtty)() 


于 读 取 的 函数 的 指针 


于 写 入 的 函数 的 指针 


于 设 定 终 站 的 函数 的 指针 


cdevsw[] 的 实体 与 bdevsw[] 相同 ， 由 conf.c 设置 (代码 清单 
12-2 ) 。 系 统管 理 者 需要 根据 系统 所 使 用 的 字符 设备 编辑 conf ,c ， 
并 对 内 核 进行 重新 构筑 。 


代码 清单 12-2 ”cdevsw[] 的 例子 《conf.c) 


1 int (*cdevsw[])() 

2 

3 &klopen, &klclose, &klread, &klwrite, &klsgtty, /* 
console */ 

4 &pcopen， &pcclose, &pcread, &pcwrite, &nodeyv, /* pc 
WA 

5 &lpopen, &lpclose, &lpread, &lpwrite, &nodeyv, /* 1p 
*/ 

6 &nodev， &nodev， &nodev， &nodev， &nodev， /* dc 
*/ 

7 &nodev， &nodev， &nodev， &nodev， &nodev， /* dh 
WA 

8 &nodev， &nodev， &nodev， &nodev， &nodev， /* dp 
*/ 

9 &nodev， &nodev， &nodev， &nodev， &nodev， /* dj 
wh 

10 &nodev， &nodev， &nodev， &nodev， &nodev， /* dn 
*/ 

11 &nulldev, &nulldev, &mmread, &mmwrite, &nodev, /* 
mem */ 

12 &nodev， &nodev， &rkread ， &rkwrite, &nodev， /* rk 
*/ 

13 &nodev， &nodev， &nodev， &nodev， &nodev， /* rf 


4 &nodev， &nodev， &nodev， &nodev， &nodev， /* rp 
15 &nodev， &nodev， &noddev， &nodev， &nodev， /* tm 
16 &nodev， &nodev， &nodev， &nodev， &nodev， /* hs 
17 &nodev， &nodev， &nodev， &nodev， &nodev， /* hp 
1 &nodev， &nodev， &nodev， &nodev， &nodev， /* ht 
0 0 

209 }; 


字符 设备 缓冲 区 


字符 设备 驱动 利用 缓冲 区 与 字符 设备 进行 数据 交换 。 缓 冲 区 的 实体 为 
cblock 结构 体 的 数组 cfree[] (代码 清单 12-3, 表 12-2) 。 


代码 清单 12-3 cblock (dmzr/tty.c) 


1 struct cblock { 

2 struct cblock *c_ next; 

3 char info[6]; 

4 }; 

5 struct cblock cfree[NCLIST]; 


表 12-2 cblock 结 


二 ak 和 人 0 时 


son Ce 


缓冲 区 由 链表 进行 管理 ，c_ 为 指向 下 一 个 cblock 结构 体 的 指 
计 ， info[] 用 于 容纳 数据 ， 每 个 cblock 结构 体 可 保存 长 度 为 6 字 
万 (文字 ) 的 数据 。 


每 个 字符 设备 驱动 都 拥有 以 clist 结构 体 (代码 清单 12-4， 表 12-3 
) 为 起 始 元 素 的 缓 促 区 的 链表 。 未 使 用 的 缓冲 区 由 cfreelist ( 代 
12-5 ) 指向 的 以 cblock 结构 体 为 起 始 元 素 的 空 有 队列 进行 管 
° 设备 驱动 在 需要 时 从 空 几 队列 取得 cblock 结构 体 ， 并 在 使 用 完 
毕 后 返还 给 室 亲 了 (图 12-2 ) 。 


代码 清单 12-4 dlist (tty.h) 


struct clist 
i 
int c_cc; 


int c_cil; 


1 
2 
3 
4 int c_cf; 
5 
6 


}; 


表 12-3 dlist 结构 体 


缓冲 区 链表 的 起 始 位 置 


缓冲 区 链表 的 结束 位 置 


代码 清单 12-5 cfreelist (dmzxr/tty.c) 


1 struct cblock *cfreelist; 


缓冲 区 池 ( 空闲 队列 ) 


cfreelist 


释放 全 ! 获取 


、 Ve BY 
clist \ 
We 一 
设备 驱动 B > 和 4- 
clist 


图 12-2 缓冲 区 的 分 配 


对 缓冲 区 的 操作 


字符 设备 驱动 通过 由 汇编 语言 编写 的 getc() 和 putc() 操作 缓冲 
区 o 

考虑 一 下 某 个 字符 设备 驱动 将 长 度 为 16 文字 (16 字 节 ) 的 字符 
串 “hellogoodbyehowa” 保 存在 缓冲 区 时 的 情况 


cblock cblock cblock 


| 


i cblock cblock cblock 


_ 


图 12-3 缓冲 区 链表 的 例子 


getc( ) 从 缓冲 区 的 起 始 位 置 取得 一 个 文字 。 图 12-4 表示 从 缓冲 区 的 
起 始 位 置 取出 文字 Ph 时 的 情况 。 


putc( ) 回 缓冲 区 的 末尾 人 退 加 一 个 文字 。 几 12-5 表示 在 图 12-4 的 基础 

上 疝 缓 神 区 的 来 尾 追 加 文字 r 时 的 情况 。 由 于 来 尾 的 cblock 结构 体 

， info[] 已 被 用 尽 ， 因 此 此 处 需要 从 空 阿 队列 中 取得 新 的 cblock 
结构 体 。 


oie 


te cblock cblock cblock 


_ 


图 12-4 getc0 


es 


人 ek cblock cblock 


图 12-5 putcO 
初始 化 缓冲 区 池 


cinit() 是 初始 化 缓冲 区 池 时 使 用 的 函 (代码 清单 12-6 ) 
动 时 由 main( ) 调用 ， 且 仅 调用 一 次 。 该 函数 将 cfree[] 的 元 系 全 
追加 至 空 亲 队列 ， 并 统计 系 J (的 种 类 ) 的 数量 ， 
保存 乡 充 计 结果 。 


代码 清单 12-6 cinit0 (dmr/tty.c) 


1 cinit() 
2{ 
3 register int ccp; 


4 register Struct cblock *cp; 
5 register struct cdevsw *cdp; 
6 
7 ccp = cfree; 
8 for (cp=(ccp+07)&~07; cp <= &cfree[NCLIST-1]; cp++) { 
9 cp->c_next = cfreelist,; 
10 cfreelist = cp; 
11 } 
12 ccp = 0; 
13 for(cdp = cdevsw; cdp->d_open; cdp++) 
14 CCp++; 
15 nchrdev = ccp; 
16 } 


2 向 空 采 队列 追加 cfree[] 的 元 素 ， 通 过 此 队列 可 反 向 参 
照 cfree[] 。 由 于 构成 cfree[] 元 素 的 cblock 结构 体 的 长 度 
为 8 字 节 ， 因 此 对 for 语句 中 的 初始 化 计算 公式 进行 调整 ， 使 起 始 
地 址 为 8 的 倍数 1。 


12~15 ”通过 统计 在 cdevsw[ ] 中 注册 的 cdevsw.d_open 处 理 
函数 的 数量 ， 可 得 到 字符 设备 (驱动 ， 的 数量， 将 统计 结果 保存 
在 nchrdev 中 。 


1 此 处 将 空间 队列 向 8 倍数 字 节 地 址 对 齐 ， 有 利于 在 getc 等 函数 中 读 取 缓 存 块 中 字符 时 若 磁 
到 8 倍数 字 节 地 址 ， 则 可 以 判断 此 缓存 块 已 经 读 尽 。 审 校 者 注 


代码 清单 12-7 nchrdev (conf.h) 


1 nt nchrdev 


12.2 LP11 设备 驱动 
以 下 以 LP11 的 设备 驱动 为 例 介 绍 字符 设备 驱动 。 


什么 是 LP11 


LP11 是 由 DEC 公司 开发 的 与 PDP-11 系列 相对 应 的 行 打印 机 ， 用 于 打 
印 所 要 求 的 文字 。 


LP11 对 必 ASCII 人 码 。 根 据 型 号 的 不 同 使 用 96 文字 或 64 文字 的 字符 
集 。64 文字 的 字符 集 称 为 half ASCII 字符 集 ， 只 支持 大 写 文字 和 部 分 


J 


输入 表 12-4 所 示 的 ASCII 码 时 ， 并 不 打印 文字 而 是 进行 相应 的 处 
用。 


表 12-4 LP11 可 处 理 的 特殊 文字 


换行 (LF) 


回 车 《CR) 。 将 打印 头 移动 至 行 的 起 始 位 


LP11 拥 有 两 个 16 位 的 寄存 器 。 一 个 是 用 来 处 理 控 制 信息 的 LP Status 寄 
存 器 ( 表 12-5 ) ， 男 一 个 是 用 来 处 理 输出 文字 的 LP Data Buffer 寄存 
器 ( 表 12-6 ) 。 当 数据 存 入 LP Data Buffer 寄存 器 后 ， 会 启动 LP11 的 
打印 处 理 ， 将 LP Status 寄存 右 的 第 7 比特 位 设 为 0。 当 打印 处 理 结 
后 ，LP Data Buffer 寄存 器 的 值 被 清空 ，LP Status 寄存 器 的 第 7 比特 位 
则 会 被 设 定 为 1。 


表 12-5 LP Status 寄存 器 


LP11 的 处 理 过 程 中 发 生 错误 时 设置 为 1 


表示 LP11 处 于 Ready 状态 。 当 LP Data Buffer 寄存 器 中 存在 数 和 
LP11 时 设 为 0。 当 LP11 的 处 理 结束 后 设置 为 1 


设置 为 1 时 表示 LP11 的 处 理 结 束 ， 或 是 发 生 了 错误 。 此 时 ， 通 过 中 断 优 先 双 
和 向 量 0200 引发 中 断 


表 12-6 LP Data Buffer 寄存 器 


j 象 文字 的 ASCI 码 。 当 设置 了 数据 之 后 ， 开 始 LP11 的 印刷 处 理 ， 结 中 


据 被 清 0 


LP11 设 备 驱 动 的 功能 
系统 管理 者 预先 生成 名 为 “/dev/lpn”(n 为 小 编号 ) 的 特殊 文件 。 
LP11 的 设备 驱动 主要 进行 下 述 处 理 (图 12-6 ) 


1. 当 程序 发 出 答 出 数据 的 请 求 时 ， 将 该 数据 追加 全 缓冲 区 。 对 换行 和 
制 表 符 等 特殊 文字 进行 相应 的 处 理 。 


2. 将 LP11 无 法 输出 的 文字 更 改 为 可 输出 的 文字 。 


3. 将 缓冲 区 的 数据 传送 至 LP11 的 寄存 器 。LP11 的 寄存 器 被 写 入 数据 
后 将 引发 LP11 的 输出 处 理 。 


4. 如 果 发 生 了 LP11 的 处 理 终了 中 断 ， 则 继续 对 LP11 输出 数据 。 


周边 设备 


换行 刍 
制 表 符 (tab ) 
《缓冲 区 ”> 


无 法 显示 的 文字 四 更 改 L914 


9 


4) 处 理 终了 中 断 


(write 


图 12-6 LP11 设备 驱动 


当 缩 进 功能 有 效 时 ， 在 行 的 起 始 位 置 首 先 输出 长 度 为 8 文字 的 空白 。 
每 一 行 最 多 输出 80 文字 ， 超 过 的 文字 会 被 忽 略 。 当 输出 一 定 行 数 之 后 
将 进行 换 页 处 理 。 

当 输 入 表 12-7 所 示 的 特殊 文字 时 ， 进 行 与 其 相对 应 的 处 理 。 


表 12-7 ASCII 码 的 特殊 文字 


删除 此 前 的 1 个 文字 


日 ， 将 打印 头 移 至 以 8 文字 为 单位 时 的 下 一 个 位 置 


回 行 打印 机 输出 “FF 换行 
本 本 向 行 打印 机 输出 “PF” 送 纸 


A 。 当 缩 进 功能 有 效 时 输出 长 度 为 8 文字 的 空 


对 使 用 half ASCII 字符 集 的 型 号 而 言 ， 首 先 在 设备 驱动 中 将 小 写 文 字 


变 为 大 写 文 字 ， 然 后 再 对 设备 进行 输出 处 理 。 此 外 ， 狗 12-8 所 示 的 符 
号 ， 将 其 变 为 可 使 用 的 符号 并 倒 加 表示 取消 的 文字 “-”。 


表 12-8 需要 更 改 的 符号 


LP11 设备 驱动 中 定义 了 名 为 1p11 的 结构 体 (代码 清单 12-8， 表 12- 
9) 。 该 结构 体位 于 LP11 设备 驱动 使 用 的 缓冲 区 的 头 部 ， 也 用 于 管理 
LP11 的 状态 信息 和 打印 头 的 位 置信 息 。 


代码 清单 12-8 lp11 (dmr/lp.o) 


10 

11 #define 
12 #define 
13 #define 
14 #define 


表 12-9 ”1p11 结构 体 


涩 。 用 于 putc() 和 getc() 


冲 区 链表 的 头 部 。 用 于 putc() 和 getc() 中 


缓冲 区 链表 的 。 用 于 putc() 和 getc() 


状态 、 控 制 信息 。 在 打开 设备 时 根据 LP11 的 型 号 和 模式 进行 相应 的 设 定 ( 参 
见 表 12-10) 


本 印 头 的 物理 位 置 


本 印 头 的 逻辑 位 置 


1 的 处 理 行 数 


表 12-10 1p11 中 的 标志 位 


EE 


只 处 理 大 写 文字 (half ASCII 字符 集 


具有 排 纸 功能 


输出 文字 后 ， 递 增 1p11.mcc 和 Lp11.ccc 的 值 记录 打印 头 在 当前 行 
中 的 位 置 。 当 需要 输出 空格 或 因为 缩 进 需要 输出 空白 时 ， 并 不 是 每 次 


都 将 其 输出 至 打印 机 ， 而 是 只 递增 1p11,ccc 的 值 。 当 需要 输出 空白 
以 外 的 文字 时 ， 首 先 输出 长 度 为 lp11.mcc 与 1p11.,ccc 差 值 的 空 
白 ， 再 输出 该 文字 。 此 处 ,将 1p11.mcc 称 为 “打印 头 的 物理 位 置 ”， 
将 Jp11, ccc 称 为 “打印 头 的 逻辑 位 置 ”。 


lpopen() 


lpopen( ) 用 于 打开 LP11 的 处 理 ( 表 12-11， 代 码 清 单 12-9) 。 对 
LP11 的 特殊 文件 执行 系统 调用 open 后 ， 在 open 的 处 理 函 数 调用 的 
openi( ) 中 执行 在 cdevsw[] .d_open( ) 中 注册 的 1popen() 。 


1popen() 首先 检查 设备 是 否 已 被 打开 ， 以 及 是 否 处 于 出 错 状 态 。 然 
后 设 定 1p11 .flag 并 将 LP Status 寄存 器 的 第 6 比特 位 设 为 1。 最 后 
让 LP11 进行 送 纸 的 控 作 。 


表 12-11 lpopen0 的 参数 


dev 在 lpopen() 


- i 


1 lpopen(dev, flag) 
2 
3 
4 if(1pi11.flag & OPEN || LPADDR->lpsr < 0) { 
5 u.u_error = EIO; 
6 return; 
7 } 
8 1p11.flag =| (IND|EJECT|OPEN); 
9 LPADDR->lpsr =| IENABLE; 
10 lpcanon(FORM); 


| 


4~7 ”如 果 LP11 已 打开 ， 或 是 处 于 出 错 状 态 ， 将 错误 代码 赋予 
U,U_error 并 返回 。LP Status 寄存 器 的 第 15 比特 位 为 错误 标志 
位 ， 当 此 标志 位 被 设置 为 1 时 ，signed int 型 的 变量 为 负 值 。 


LPADDR 表示 LP11 寄存 器 映射 的 地 址 。1lpsr 为 用 于 操作 LP11 寄存 器 
的 结构 体 的 成 员 变 量 (代码 清单 12-10 ) 。 


代码 清单 12-10 LPADDR (dmr/ken.c) 


1 #define LPADDR ©0177514 
2 

3 struct { 

4 int lpsr; 


int lpbuf; 


5 
6 }; 


8~10 ”对 LP11 进行 初始 化 处 理 。 首 先 设 定 1p11.flag 和 LP 
Status 寄存 器 ， 然 后 让 LP11 进行 送 纸 操 作 ， 再 重 置 打 印 头 的 位 
请 FORM 表示 ASCII 码 中 的 送 纸 字符 (FF) (代码 清单 12- 
11) 。 


代码 清单 12-11 FORM (dmr/lp.o) 


1 #define FORM 014 


]pwrite() 


lpwrite() 使 LP11 打印 字符 串 (代码 清单 12-12 ) 。 对 LP11 的 特殊 
文件 执行 系统 调用 write 后 ， 在 write 的 处 理 函 数 调用 的 


writei() 中 将 执行 在 cdevsw[] ,d_write() 中 注册 的 
lpwrite()。: 


执行 cpass() ， 从 用 户 空 间 读 取 1 字 节 的 数据 ， 调 用 lpcanon() 使 
LP11 输 出 该 数据 。 重复 此 过 程 直至 所 有 数据 都 被 输出 。 


代码 清单 12-12 ”lpwrite0 (dmr/lp.o) 


lpwrite() 
{ 
register int c; 
while ((c=cpass() )>=0) 
lpcanon(c); 


1 
2 
3 
4 
5 
6 
7 


} 


lpcanon() 


lpcanon( ) 执行 与 参数 指定 的 长 度 为 1 字 市 的 文字 相对 应 的 处 理 ( 表 
12-12， 代 码 清单 12-13 ) 。 如 果 为 一 般 文字 ， 则 执行 ljpoutput() 使 
LP11 打印 该 文字 。 如 果 为 特殊 文字 ， 则 进行 与 其 对 应 的 处 理 。 


表 12-12 lpcanon0 的 参数 


pcanon(c ) 


1 
2 
3 register ci1, c2; 
4 
5 


if(1p11.flag&CAP) { 
if(c1i>='a' && c1i<='z') 
cl =+ 'A'-'a'; else 
Switch(c1) { 


case '{': 
c2= "'('; 
goto esc; 
case '}': 
c2 = ')'; 
goto esc; 
case ' i': 
[2 NE 
goto esc 
case '|': 
c2= "1"; 
goto esc; 
CaSe '~': 
c2 = "A'，; 
esc: 
lpcanon(c2); 
1p1i1i.ccc--; 
cl = '-'; 
} 
} 
Switch(c1) { 
case '\t': 
lpii.ccc = (Lp11.ccc+8) & ~7; 
return; 
case FORM: 
case '\nNn': 


if((1p11.flag&EJECT) == | | 

LIp11.mccl=0 || lpii.mlc!=0) 区 

lpii.mcc = 0; 

1p1i1.mlc+t+; 

if(1p1ii.mlc >= EJLINE && 1p11.flag&EJECT) 
c1 = FORM; 

lpoutput(c1); 

if(c1 == FORM) 
Lp11.mlc = 0; 


case '\r': 


57 Lp11.ccc = 0; 


58 if(1p11.flag&IND) 

59 lpii.ccc = 8; 

60 return; 

61 

62 case 010: 

63 If(1Lp11.ccc > 0) 

64 Lp11.ccc-- 

65 return 

66 

67 case ' ': 

68 1p11.ccct+t+; 

69 return; 

70 

71 default: 

72 if(lpii.ccc < lpii.mcc) { 
73 lpoutput('\r'); 

74 lpii.mcc = 0; 

75 } 

76 if(lpii.ccc < MAXCOL) { 
77 while(1LIp11.ccc > Lp11.mcc) { 
78 lpoutput(' '); 
79 1p11.mcc+t+; 

80 } 

81 lpoutput(c1); 

82 1p11.mcc+t+; 

83 } 

84 1p11.ccct+t+; 

85 } 

86 } 


6~35 ”使 用 half ASCII 码 字 符 集 时 的 处 理 。 如 果 是 小 写 文字 ， 则 


将 其 变 为 大 写 文 字 。 如 果 是 “{” 等 特殊 文字 ， 将 其 变 为 可 输出 的 文 
字 后 ， 将 cd 设 定 为 表示 取消 的 文字 “-”， 然 后 继续 输出 其 他 文 
字 。 


39~41 ”对 制 表 符 (Nt ) 的 处 理 。 调 整 1p11. ccc 使 其 成 为 8 的 
倍数 。 


43~54 ”对 送 纸 和 换行 符 (\n ) 的 处 理 。 如 果 打 印 机 没有 排 纸 功 
能 ， 或 当前 页 上 已 有 打印 的 文字 ， 则 将 Lp11.mcc 设 为 0 并 递增 
1Lp11.mlc 的 值 。 如 果 每 页 可 打印 的 行 数 较 多 (代码 清单 12- 

14) ， 且 打印 机 具有 排 纸 功能 ， 则 进行 送 纸 ， 和 否则 的 话 ， 则 输出 


原 有 的 送 纸 或 换行 待 。 送 纸 后 ， 将 表示 行 数 的 变量 1p11.mlc 清 
0 o 


代码 清单 12-14 EJLINE (dmr/lp.c) 


1 #define EJLINE 60 


56~60 “对 回 车 符 (\r ) 的 处 理 。 将 1p11.ccc 设 为 0。 如果 设 
置 了 缩 进 标志 位 ， 则 将 1p11.ccc 设 定 为 8。 


62~65 ”对 Back Space 的 处 理 。 如 采 1p11.ccc 的 值 大 于 等 于 
1， 则 递减 该 值 。 


67~69 “对 空白 的 处 理 。 递 增 1p11.ccc 的 值 。 


71~83 ”如 果 是 一 般 文 字 ， 则 进行 输出 。 当 Lp11.ccc 小 于 
1p11.mcc 时 进行 回 车 处 理 。 如 果 lp11.ccc 小 于 MAXCOL (每 
行 可 输出 的 最 大 文字 数 。 代 码 清单 12-15) ， 那 么 在 输出 文字 后 ， 
递增 1p11,mcc 的 值 。 如 果 1p11.ccc 大 于 1Lp11,mcc 时 ， 输 
1p11.ccc 与 1p11.,mcc 差 值 的 空白 ， 调 整 打印 头 的 物 
理 位置 。 


代码 清单 12-15 MAXCOL (dmr/lp.o 


1 #define MAXCOL 80 


84 ”递增 1p11.ccc 的 值 。 虽 然 无 需 打 印 ， 但 也 需 调整 打印 头 的 
逻辑 位 置 。 


lpoutput() 


lpoutput() 使 LP11 打印 1 个 文字 ( 表 12-13， 代 码 清单 12-17 ) 。 
调用 putc( ) 向 缓冲 区 传送 数据 后 ， 执 行 1pstart() 启动 LP11 的 处 
理 。 但 是 ， 当 缓冲 区 内 的 数据 (等 待 输出 的 字符 串 ) 较 长 时 (LPHWAT 
大 于 等 于 100 ) ， 为 了 避免 出 现 缓冲 区 池 容 量 不 足 的 情况 ， 进 程 进 入 
睡 眼 状 态 。 随 着 使 用 缓冲 区 内 的 数据 (LPLWAT =50 ) ， 进 程 通过 
lpint() 被 唤醒 (代码 清单 12-16) 。 


代码 清单 12-16 LPLWAT 与 LPHWAT (dmr/lp.o) 


1 #define LPLWAT 50 
2 #define LPHWAT 100 


表 12-13 ”lpoutput( 的 参数 


poutput(c) 


If (lpii.cc >= LPHWAT) 
sleep(&1p11, LPPRI); 

putc(c, &1p11); 

Sp]14() ; 

lpstart(); 

sp10(); 


3~4 ”如 果 缓 冲 区 内 的 数据 长 度 大 于 等 于 LPHWAT (100) 个 文 
字 ， 则 进入 睡眠 状态 直至 数据 被 使 用 。 


5 执行 putc() ， 向 缓冲 区 追加 工 字 下 的 数据 。 


6 ”将 处 理 絮 优先 级 提升 至 4， 以 防止 在 LP11 的 输出 过 程 中 发 生 
由 LP113 引 发 的 中 断 。 


7 ”执行 lpstart() 启动 LP11 的 输出 处 理 。 
8 当 LP11 的 处 理 结束 后 ， 将 处 理 器 优先 级 重 置 为 0。 
lpstart() 


lpstart() 用 于 启动 LP11 的 处 理 (代码 清单 12-18 ) 。 如 果 LP11 处 

等 待 输入 的 状态 ， 且 绥 冲 区 内 存在 数据 时 ， 从 绥 冲 区 取出 长 度 为 1 
字 节 的 数据 ， 将 其 赋予 LP Data Buffer 寄存 器 。 该 寄存 器 被 设 定数 据 
后 ，LP11 将 自动 进行 输出 文字 的 处 理 。 


代码 清单 12-18 lpstart0) (dmr/lp.c) 


lpstart() 
{ 
register int c; 
while (LPADDR->]psr&DONE && (c = getc(&1p11)) >= 0) 
LPADDR->lpbuf = c; 
} 


1 
2 
3 
4 
5 
6 
7 


lpint() 


LP11 在 结束 输出 文字 的 处 理 后 将 引发 中 断 ，Lpint( ) 为 该 中 断 的 处 理 
函数 (代码 清单 12-19 ) 。 


执行 ljpstart() ， 如 果 缓 冲 区 内 存在 残留 数据 则 继续 印刷 处 理 。 当 
缓冲 区 内 的 数据 数量 〈 等 待 输出 的 字符 串 数 ) 为 0 或 LPLWAT (=50 
) 时 ， 唤 醒 因 等 待 数据 输出 而 进入 睡 眼 状态 的 进程 。 


代码 清单 12-19 lpint0 (dmr/lp.o) 


lpint() 
{ , | 
register int c; 
lpstart(); 
if (Lp11.cc == LPLWAT || lpii.cc == 0) 
wakeup(&1p11); 


1 
2 
3 
4 
5 
6 
7 
8 


} 


lpclosel() 

lpclose() 用 于 关闭 LP11 (代码 清单 12-20 ) 。 对 LP11 的 特殊 文件 
执行 系统 调用 close 后 ， 将 在 close 的 处 理 函 数 调用 的 closei() 
中 执行 在 cdevsw[] .d_close() 中 注册 的 lpclose()。 
lpclose( ) 使 LP11 进行 送 纸 处 理 ， 并 将 1p11.flag 清 0。 


表 12-14 lpclose0) 的 参数 


四 | 
在 lpclose() 中 未 使 用 


代码 清单 12-20 Ilpclose() (dmr/lp.o) 


lpclose(dev, flag) 
{ 


lpcanon(FORM); 
1p11.flag = 0; 


} 


12.3 小结 
。 字符 设备 驱动 表 为 cdevsw[]。 


。 字符 设备 张 动 以 字 节 为 单位 向 缓冲 区 传送 数据 ， 然 后 再 通过 缓冲 
区 将 数据 传送 给 设备 。 


第 13 章 电 传 终端 


13.1 什么 是 电 传 终端 


电 传 终端 是 用 于 在 相 离 的 两 点 间 进 行 通信 的 输入 输出 装置 。UNIX V6 

内 核 支 持 电 传 终端 的 处 理 ， 用 户 通 过 电 传 终端 可 以 以 对 话 的 形式 操作 

。 。 系列 附带 了 由 Teletype 公司 制造 的 ASR-33 型 电 传 终 端 
图 13-1 


图 片 : Marcin Wichary, GFDL 


图 13-1 ASR-331 


| 1 http://ja.wikipedia.org/wiki/ASR-33 


电 传 终端 由 输入 雄 置 和 输出 于 置 组 成 。 如 采 将 输入 逆 置 看 作 走 现在 的 
键 弄 ， 输 出 装置 看 作 显示 器 (或 打印 机 ) 的 话 ， 应 该 更 容易 理解 。 


电 传 终端 采用 ASCII 码 。 输 入 数据 以 行为 单位 进行 处 理 。 如 宁 只 是 输 
入 字符 串 ， 那 么 输入 的 数据 只 会 倚 存 在 缓 种 区 内 ， 不 会 被 传达 到 系统 
,用户 空间 ) “只 有 当 输 入 换行 后 ， 缓 种 区 站 的 数据 才 会 传送 到 系 
SJL? 

电 传 终端 的 接口 

在 连接 PDP11/40 与 电 传 终端 时 ， 需 要 使 用 电 传 终端 接口 。 该 接口 与 
Unibus 并 行 通信 ， 与 电 传 终端 进行 串 行 通信 (图 13-2) 。 


ASR-33 等 


电 传 终 站 


电 传 终 端 接口 


Unibus 


并 行 通信 串 行 通信 


图 13-2 电 传 终端 按 # 


电 传 终端 接口 有 KL11、DC11、DH11 等 多 个 种 类 。 设 备 驱 动 通过 操作 
接口 拥有 的 寄存 絮 控 制 终端 。 根 据 接口 种 类 的 不 同 ， 其 规格 也 有 所 不 
同 ， 需 要 分 别提 供 相 应 的 设备 驱动 。 与 接口 种 类 的 差异 无 关 的 共用 处 
理 定义 在 名 为 tty.c 的 文件 中 。 


为 了 运行 系统 操作 台 (console) ， 必 须 将 1 台电 传 终 端 与 KL11 相连 。 
0 
2 13-3 ° 


k 


tt 


必须 连接 1 个 系统 操作 人 台 用 户 终端 0~N 台 
图 13-3 多 台 终 端 


特殊 文件 


系统 管理 员 需 要 生成 名 为 /dev/ttyX (X 为 任意 文字 ) 的 特殊 文件 。 此 
外 ， 各 个 终端 的 设 定 数据 保存 在 名 为 /etc/ttys 的 文件 中 。 


系统 启动 时 ， 生 成 与 各 终端 相对 应 的 进程 ， 并 等 待 用 户 的 连接 与 登 
录 。 此 时 确定 了 标准 输入 (user,u_ofile[9] ) 、 标 准 输出 

(user .u_ofile[1] ) 和 标准 错误 输出 (user ,u_ofile[2] ) 与 
0 (严格 来 讲 ， 标 准 错误 输出 在 用 户 登 录 时 才 被 打 


计 


tty 结构 体 


终端 拥有 属于 自己 的 tty 结构 体 〈 代 码 清单 13-1， 表 13-1 ) 。tty 结 
构 体 管理 终端 的 设 定 和 控制 信息 ， 可 以 以 终端 为 单位 进行 设 定 。 


终端 的 tty 结构 体 与 proc .p_ttyp 相关 联 ,进程 可 以 以 此 管理 负责 控 
制 自己 运行 的 终端 。 比 如 ， 通 过 此 处 的 关联 信息 ， 终 端 可 对 自己 控制 
的 所 有 进程 发 送信 号 。 


代码 清单 13-1 tty 结构 体 (tty.h) 


struct tty 
{ 


struct clist t_rawq; 
struct clist t_cang; 
struct clist t_outq; 
int t_flags,; 

int *t_addr; 

char t_delct; 

char t_col; 

char t_erase; 

char t_kill; 

char t_state; 

char t_char; 

int t_speeds ; 

int t_dev; 


‘OOOOORRODP 


}; 


/* modes */ 

#define HUPCL 

#define XTABS 

#define LCASE 

#define ECHO 

#define CRMOD 

#define RAW 

#define ODDP 

#define EVENP 

#define NLDELAY 

#define TBDELAY 006000 
#define CRDELAY 030000 
#define VTDELAY 040000 


/* Internal state bits */ 
#define TIMEOUT 01 
#define WOPEN 02 
#define ISOPEN 04 
#define SSTART 010 
#define CARR_ON 020 
#define BUSY 040 
#define ASLEEP 0100 


}; 


表 13-1 tty 结构 体 


于 管理 从 终端 输入 的 数 


输入 数据 经 过 适当 更 改 后 的 数 


管理 向 终端 输出 的 数据 


量 。 将 作为 系统 调用 stty 和 gtty 的 操作 对 象 (参照 表 13-2) 


*t_addr | 终端 接口 寄存 器 的 基地 址 


t_rawq 中 分 隔 符 的 计数 器 


终端 打印 头 的 水 平方 向 的 位 置 。 用 于 计算 输出 延迟 处 理 时 间 


川 除 的 1 个 文字 。 将 作为 系统 调用 stty 和 gtty 的 操作 对 象 


被 删除 的 1 行文 字 。 将 作为 系统 调用 stty 和 gtty 的 操作 对 象 


状态 (参照 表 13-3 
各 时 


(参照 ) 
临时 区 域 


j stty 和 gtty 的 操作 对 象 


t_dev 终端 的 设备 编 : 


表 13-2 tty 的 标志 位 


关闭 外 再 时 切 晰 过 


XTABS 模式 。 和 输出 “At 时 ， 使 打印 头 输出 空白 直至 已 输出 字符 的 长 度 
XTABS (包括 空白 ) 为 8 字 节 的 倍数 。 并 非 让 终端 直接 处 理 制 表 符 ， 而 是 在 


设备 驱动 端 模拟 再 现 制 表 符 


全 清理 大 与 文 
ECHO 模式 。 输 入 到 终端 的 文字 也 同时 输出 至 终端 


_ 9 - - 


ODDP 用 奇 校 验 


RAW RAW 模式 。 不 进行 删除 1 文字 、 删 除 1 行 ， 或 通过 “进行 的 转 义 
(escape) 处 理 ， 将 输入 的 字符 串 直 接 传 递 给 系统 


EVENP 


对 应 表示 NL 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 


> 应 表示 TAB 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 


对 应 表示 CR 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选择 


对 应 表示 VT 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选择 


表 13-3 tty 状态 的 标志 位 


的 出生 再 中 
和 开设 和 的 外 于 结 来 


为 t_addr 设 定 特 殊 的 启动 处 理 。 只 被 一 部 分 终端 接口 采用 
等 待 使 用 t_outd 的 数据 


tty 结构 体 拥 有 3 个 缓冲 区 队列 (缓冲 区 链表 ) 。 从 终端 输入 的 数据 
由 队列 tty.t_rawgq 管理 ， 对 输入 数据 进行 适当 变化 后 的 数据 由 
tty,t_cand 管理 ， 而 输出 数据 由 队列 tty.t_outq 管理 (图 13-4 
) o 


输出 装置 


输入 装置 


图 13-4 3 个 缓冲 区 


如 前 所 述 ， 从 终端 输入 的 数据 以 行为 单位 进行 处 理 。 如 果 输 入 了 换行 
符 ，tty.t_rawq 中 将 追加 1 个 与 其 对 应 的 分 隔 符 (=0377 ) 。 


tty.t_rawd 中 分 隔 符 的 数量 ， 即 处 理 单位 的 数量 ， 由 
tty.t_delct 管理 。 


终端 对 〈 由 缓 神 区 队列 保持 的 ， 未 向 系统 传送 的 ) 输入 的 字符 串 ， 可 
以 删除 其 中 的 工 个 文字 或 工行 文字 ， 也 可 以 对 每 台 终端 分 别 设 定 在 和 输 
入 何 种 文字 时 进行 上 述 删除 处 理 。tty 结构 体 的 tty.t_erase 与 
tty.t_kill 对 应 上 壕 设 定 ， 在 缺 省 状态 下 输入 “#* 时 删除 1 个 文字 ， 
输入 “@” 时 删除 1 行文 字 。 


用 户 程序 通过 疝 终 端的 特殊 文件 执行 系统 调用 stty 和 gtty 设 定 终 
端 。 但 是 ， 可 设 定 的 值 仅 限于 tty 结构 体 的 tty.t_erase 、 
tty.t_kil1、tty,t_speeds 和 tty.t flags。 


根据 终端 的 不 同 ， 在 对 特殊 文字 进行 处 理 时 有 可 能 发 生 额 外 的 延迟 。 
适当 设 定 tty.t_flags 可 使 终端 共用 处 理 进 行 适 当 的 延迟 等 待 处 
理 。 


此 外 ， 根 据 所 使 用 的 终端 ， 可 使 用 的 ASCII 代码 有 可 能 受到 限制 。 当 
终端 只 能 处 理 大 写 文 字 时 ， 从 终端 输入 的 大 写 文字 将 变 为 小 写 文 字 ， 
回 终 站 输出 的 文字 则 变 成 大 写 文 字 。 因 此 ， 终 端 和 系统 内 部 所 处 理 的 
文字 类 型 分 别 统一 至 大 写 文 字 和 人 小写 文 字 。 必 外 ， 当 ASCII 码 受到 限 
制 时 ， 终 端 对 无 法 处 理 的 符号 ， 如 表 13-4 所 示 ， 会 将 其 变 为 反 笠 线 和 
可 处 理 符 号 的 组 合 。 


表 13-4 发 生变 化 的 符号 


对 表 13-5 所 示 的 ASCII 码 进 行 输入 输出 时 ， 将 在 系统 内 或 终端 内 进行 
特殊 的 处 理 。 


表 13-5 ASCII 码 特殊 文字 


EOT (End Of Transmission) 终止 传送 
BS (Back Space) 删除 1 个 文字 


HT (Horizontal Tab) 追加 水 平方 向 的 tab 


NL (New Line) 追加 换行 


CR (Carriage Return) 使 打印 头 回 到 行头 


FS (File Separator) 


0177 DEL (Delete) 发 送 SIGINT 


maptabl] 


终端 采用 ASCII 字符 集 。 若 干 ASCII 码 用 于 控制 终端 如果 希 望 按照 
一 般 文字 进行 处 理 ， 需要 在 0 这 些 文字 
(ASCI 码 ) 由 maptab[] 管理 (代码 清单 13-2) 。 


在 代码 清单 13-2 所 示 的 例子 中 ， 〈 缺 省 情况 下 ) 输入 “#” 将 删除 一 个 文 
字 ， 但 输入 “\#” 后 将 传送 “#” 本 里 。“#” 的 ASCII 码 为 043， 将 
maptab[0943] 设 定 为 #”。 


此 外 ， 本 例 中 在 反 凶 线 之 后 输入 小 写 文字 时 ， 该 文字 特 变 为 相应 的 大 
写 文学 。 


代码 清单 13-2 maptab[] (dmr/tty.c) 


maptab [ ] 


"OO 


000,000,000, 000,004,000,000, 69909, 
000,000,000, 9000,000,000,000, 96909, 
000,000,000, 900,000,000,000, 009, 
000, 000,000, 000,000,000,000, 699, 
600, '|',000, '#',000,000,000,' 1", 
'{','}',000,000,000,000,000,000, 
000, 000,000, 000,000,000,000, 0009, 
900, 000,000, 000,000,000,000, 9099, 
'@' ,000,000, 900, 000,000,000, 9099, 
000, 000,000, 0900,000,000,000, 9699, 
000,000,000, 900,000,000,000, 909009, 
000, 000,000, 000,000,000, '~', 0909, 
000,'A','B','C','D','E','F','6", 
Hy" I J KL MN"0", 
‘Pp stQ RS TU VW 
'x','Y','Z',000,000,000,000,000, 


‘OOONOOORRODP 


partabl] 


电 传 终 出 使 用 8 比特 的 ASCII 码 传 送 数 据 ， 其 中 7 比特 为 ASCII 码 ， 
第 8 比特 位 为 偶 校 验 位 。 设 定 校 验 位 时 需要 使 用 partab[] (代码 清 


单 13-3， 表 13-6 ) 。 与 maptab[] 相同 ， 与 某 个 ASCII 码 n 所 代表 的 
文字 相对 应 的 partab[] 元 素 为 partab[n] 。 


partab[] 不 仅 表示 校 验 位 ， 也 表示 各 个 文字 (ASCII 码 ) 将 引发 何 
种 操作 。 在 输出 字符 串 时 ， 将 使 用 此 信息 来 判断 是 否 需 要 延迟 输出 。 


代码 清单 13-3 partab[] (dmr/partab.c) 


char partab[] 
0001, 0201, 0201, 0001, 0201, 0001, 0001, 0201, 
0202, 0004, 0003,0205, 0005, 0206, 0201, 0001， 
0201, 0001, 0001, 0201, 0001, 0201, 0201, 0001， 
0001, 0201, 0201, 0001, 0201, 0001, 0001, 0201, 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000, 0200,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000, 0200,， 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000, 0200,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000, 0200,， 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000, 0200,， 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0200, 0000, 0000, 0200, 0000, 0200, 0200, 0000,， 
0000, 0200, 0200, 0000, 0200, 0000, 0000,0201 


含 位 。 位 于 7 比特 的 ASCII 码 之 前 


所 引发 的 特殊 操作 的 种 类 (参见 13.6 节 的 “ttyoutput()”) 


KL11/DL11 


与 终端 相关 的 代码 分 为 两 类 : 终端 共用 人 处理 和 各 终端 接口 专用 的 设备 
有 驱动。 虽然 终 端 处 理 的 大 部 分 都 集中 在 终端 共用 处 理 ， 但 由 于 处 理 的 
流程 涉及 上 述 两 类 代码 ， 因此 下 文 将 对 两 者 进行 同时 介 绍 。 下 面 将 以 
KL11/DL11 的 设备 驱动 为 例 ， 介 绍 终 六 接口 的 设备 驱动 


KL11/DL11 拥有 4 个 16 比特 的 寄存 器 。 对 终 六 内 的 输入 和 癌 终 端的 输出 
分 别 具 有 属于 自己 的 控制 寄存 器 和 数据 寄存 器 ( 表 13-7) 。 


另外 ，KL11/DL11 具有 1 个 端口 ， 可 以 连接 1 台 终 端 。 系 统 也 可 以 连 
接 多 个 KL11DL11 接口 。 


表 13-7 KL11DL11 的 寄存 器 


Receiver Status 寄存 器 终端 输入 控制 寄存 器 (参见 表 13-8) 
Receiver Buffer 寄存 器 终端 输入 数据 寄存 器 (参见 表 13-9) 


Transmitter Status 寄存 器 终端 输出 控制 寄存 器 (参见 表 13-10) 
Transmitter Buffer 寄存 器 终端 输出 数据 寄存 器 (参见 表 13-11) 


表 13-8 klrcsr 


一 一 一 


接收 处 理 (将 数据 传送 至 klrbuf) 结束 时 设置 为 1 


! 断 优先 级 4， 向量 060 将 引发 


许可 。 此 比特 变 为 1 时 将 第 7 比特 位 清 


表 13-9 klrbuf 


17 比特 ASCII 码 和 头 部 的 偶 校 验 位 所 构成 的 8 比特 ASCII 码 


已 做 好 接受 请 求 的 准 


级 4， 向 量 064 将 引发 


。 本 书 不 做 详细 说 明 


表 13-11 kltbuf 


比特 位 含义 


17 比特 ASCII 码 和 头 部 的 偶 校 验 位 所 构成 的 8 比特 ASCII 码 


KL11/DL11 设 备 驱 动 的 规格 


各 终端 被 赋予 一 系列 的 小 编号 ， 各 接口 的 寄存 器 被 映射 到 如 代码 清单 
13-4 和 图 13-5 所 示 的 内 核 空 间 的 高 位 地 址 。 


代码 清单 13-4 KLVDL11 的 基地 址 (dmxr/kl.o) 
1 #define KLADDR 0177560 


2 #define KLBASE 0176500 
3 #define DLBASE 0175610 


内 核 空间 高 位 地 址 
DLBASE J NKL11 ~ : DL11 连 接 的 终端 
KLBASE | 1~NKL11-1: KL11 连 接 的 终端 
0176500 


KLADDR | 0: 系统 操作 台 ( console ) 
0177560 


图 13-5 ”KL1UDL11 地 址 


与 KL11 连接 的 供 系 统 操 作 台 使 用 的 终端 ， 对 应 的 寄存 器 的 基地 址 被 映 
射 至 KLADDR (0177560 ) ， 与 KL11 连接 的 其 他 终端 相对 应 的 寄存 器 
被 映射 至 KLBASE (0176500 ) 之 后 的 地 址 ， 与 DL11 连接 的 终端 相对 


应 的 寄存 器 被 映射 至 DLBASE (0175610 ) 之 后 的 地 址 。NKL11 与 
NDL11 分 别 表示 系统 中 存在 的 KL11 与 DL11 接口 的 数量 。 系 统管 理 者 
需要 根据 系统 环境 修改 NKL11 与 NDL11 的 值 ， 并 重新 构筑 内 核 。 代 
码 清 单 13-5 的 示例 中 只 存在 1 个 KL11 接口 ， 这 说 明 只 存在 一 台 供 系 
统 操作 人 台 使 用 的 系统 终端 。 


代码 清单 13-5 NKL11 和 NDLI11 (dmr/kl.c) 


1 #define NKL11 1 
2 #define NDL11 0 


KL11/DL11 设备 驱动 使 用 tty 结构 体 的 数组 kl111[] 管理 各 终端 的 信 
上 妃 (代码 清单 13-6 ) 。 设 备 的 小 编号 对 应 kl111[] 的 数组 下 标 。 


代码 清单 13-6 Kl11[] (dmr/kl.c) 


1 struct tty kl11[NKL11+NDL11]; 


KL11/DL11 设 备 驱动 画 数 


在 代码 清单 13-7 的 示例 中 ， 对 于 cdevsw[] 的 大 编号 0， 注册 了 下 述 
KL11/DL11 设备 张 动 函数 : kLlopen()、klclose()、klread()、 
KJwriIte()、klLsgtty() 。 


除了 上 述 函 数 ， 再 加 上 终端 处 理 结束 时 引发 中 断 的 处 理 函 数 
kJLxint() ， 以 及 终端 输入 时 引发 中 断 的 处 理 函 数 klrint() ， 即 构 
成 了 KL11DL11 设备 张 动 的 全 部 函数 。 


代码 清单 13-7 cdevsw[] (conf.c) 


1 int (*cdevsw[])() 
2 


3 &klopen, &klclose, &klread, &klwrite, &klsgtty, /* 
console */ 


13.2 ”终端 的 开启 和 关闭 


klopen() 

klopen( ) 是 用 于 打开 KL11 终端 的 设备 驱动 ( 表 13-12， 代 码 清单 
13-8 ) 。 对 终 的 特殊 文件 执 和 - 系 完 调 用 open ， 将 调用 注册 于 在 
cdevsw[].d_open 的 klopen()。 


根据 小 编号 从 kL11[] 取得 相应 的 tty 绪 构 体 ， 将 执行 进程 与 终端 相 
关联 。 


计算 该 终端 的 地 址 ， 对 tty 结构 体 和 寄存 硕 进 行 初 始 化 设 定 。 
表 13-12 klopen( 的 参数 


代码 清单 13-8 klopen() (dmr/kl.o) 


1 klopen(dev, flag) 

2 1 

3 register char *addr; 

4 register struct tty *tp; 

5 

6 if(dev.d minor >= NKL1i1+NDL11) { 
7 U,.U_error = ENXIO; 

8 return; 


9 } 

10 tp = &kl1ii[dev.d_ minor]; 

11 If (uyu.u_procp->p_ttyp == 0) { 

12 u.u_procp->p_ttyp = tp; 

13 tp->t_dev = dev; 

14 } 

15 addr = KLADDR + 8*dev.d_ minor; 

16 if(dev.d minor) 

17 addr =+ KLBASE-KLADDR-8; 

18 if(dev.d_ minor >= NKL11) 

19 addr =+ DLBASE-KLBASE-8*NKL11+8; 
20 tp->t_addr = addr; 

21 if ((tp->t_state&ISOPEN) == 0) { 

22 tp->t_state = ISOPEN|CARR_ON; 

23 tp->t_flags = XTABS|LCASE|ECHO|CRMOD; 
24 tp->t_erase = CERASE,; 

25 tp->t_kill = CKILL; 

26 } 

27 addr->klrcsr =| IENABLE|DSRDY|RDRENB ， 
28 addr->kltcsr =| IENABLE; 

29 } 


6~9 ”检查 小 编号 是 否 合适 。 


10 ”根据 小 编号 ， 从 kl111[] 取得 相应 的 tty 结构 体 。 


11~14 ”如 琳 试 图 打开 的 终端 进程 尚未 与 终端 相关 联 ， 则 将 刚才 取 
得 的 tty 结构 体 分 配 与 该 进程 ， 并 设 定 tty 结构 体 的 设备 编号 。 


15~20 ”计算 终端 接口 寄存 右 的 基地 址 。 将 计算 式 进行 简化 后 得 到 
下 述 结果 。 


。 小 编号 0 : tp->t_addr = KLADDR 


。 小 编号 1~NKL11-1: tp->t_addr = KLBASE + 8 x( 小 
编号 -1) 


。 小 编号 NKL11~: tp->t_addr = DLBASE + 8 x( 小 编 
号 -NKL11) 


21~26 “检查 终端 状态 ， 如 果 疝 未 打开 ， 则 对 tty 结构 体 进 行 初 
台 化 处 理 。 


27~28 “对 终端 接口 的 寄存 器 进行 初始 化 。klLrcsr 与 kltcsr 是 
为 了 操作 寄存 器 而 定义 的 结构 体 的 成 员 (代码 清单 13-9) 。 
IENABLE 、DSRDY 、RDRENB 是 为 了 设置 寄存 器 而 定义 的 值 〈 代 
码 清单 13-10， 代 码 清单 13-11) 。 


代码 清单 13-9 klregs (dmr/kl.c) 


1 struct klregs { 
2 int klrcsr; 
3 int klrbuf; 
4 int kltcsr; 
5 
6 


int kltbuf; 
} 


代码 清单 13-10 IENABLE (tty.h) 


1 #define IENABLE 0100 


代码 清单 13-11 DSRDY fl RDRENB (dmr/kl.c) 


1 #define DSRDY 02 
2 #define RDRENB 01 


klclose() 


klclose() 用 于 对 KL11 进行 关闭 处 理 ( 表 13-13， 代 码 清 单 13-12 
) 。 对 终端 的 特殊 文件 执行 系统 调用 close ， 将 调用 注册 于 


cdevsw[].d_close 的 klclose()。 


根据 小 编号 从 kL11[ ] 取得 相应 的 tty 结构 体 ， 刷 新 tty 结构 体 持 有 
的 队列 。 并 将 tty 结构 体 的 tty.t_state 清 0。 


表 13-13 klclose() 的 参数 


代码 清单 13-12 klclose() (dmr/kl.o) 


klclose(dev) 
register struct tty *tp; 
tp = &klii[dev.d_ minor]; 


wflushtty(tp); 


1 
2 
3 
4 
5 
6 
7 tp->t_state = 0; 
8 


} 


wflushtty() 


wflushtty() 用 于 清空 队列 ( 表 13-14， 代 码 清单 13-13 ) 。 如 果 
tty.t_outq 中 残留 了 数据 ， 则 进入 睡眠 状态 直到 数据 被 使 用 。 


将 清空 队列 的 处 理 在 flushtty( ) 中 进行 。 
表 13-14 ”wflushtty0 的 参数 


机 Eee 


代码 清单 13-13 wflushtty0 (dmzr/tty.o) 


wflushtty(atp) 
struct tty *atp; 


register struct tty *tp; 


tp = atp; 

spl5(); 

while (tp->t_outq.c _ cc) { 
tp->t_state =| ASLEEP; 
sleep(&tp->t_outq, TTOPRI); 


flushtty(tp); 
sp10(); 


8~11 ”如 果 tty.t_outgq 中 残留 了 数据 ， 则 将 tty 结构 体 设置 
为 ASLEEP 状态 ， 然 后 使 进程 进入 睡眠 状态 。 当 tty.t_outq 变 
为 空 或 置 为 TTLOWAT 状态 (后 述 ) 时 进程 被 唤醒 。 

flushtty(0) 


flushtty() 用 于 清空 tty 结构 体 持 有 的 3 个 队列 ( 表 13-15， 代 码 
清单 13-14) 。 


表 13-15 flushtty0 的 参数 


7 


E 


tty 结构 体 


代码 清单 13-14 flushtty() (dmr/tty.c) 


1 flushtty(atp) 
2 struct tty *atp; 
{ 


register struct tty *tp; 
register int sps; 


tp = atp; 

while (getc(&tp->t_canq) >= 0); 
while (getc(&tp->t_outq) >= 0); 
wakeup(&tp->t_rawq); 


wakeup(&tp->t_outq); 

sps = PS->integ,; 

spl5(); 

while (getc(&tp->t_rawq) >= 0); 
tp->t_delct = 0; 

PS->integ = sps; 


8~9 将 tty.t_canq 和 tty.t_outq 清空 

10~11 ”唤醒 等 待 tty.t_rawq 和 tty.t_outq 被 清空 的 进程 。 
12~13 ”保存 PBW， 并 将 处 理 右 的 优先 级 设 为 5。 

14 将 tty,t_rawd 清空 。 

15 ”由 于 tty.t_rawgq 已 被 清空 ， 因 此 将 分 隔 和 从 计数 姻 也 清 0。 


16 ”恢复 保存 的 PSW 。 


13.3 ”终端 的 设 定 


gtty() 


gtty( ) 为 系统 调用 gtty 的 处 理 函 数 ( 表 13-17， 代 码 清单 13-15 
) 。 该 函数 将 终端 的 相关 信息 (tty 结构 体 的 数据 ) 读 取 至 用 户 空 
间 ， 所 取得 的 数据 与 保存 区 域 的 对 应 关系 如 表 13-16 所 示 。 


大 部 分 处 理 在 sgtty( ) 中 进行 。 该 函数 为 gtty() 与 stty( ) 的 共 
用 函数 。 


表 13-16 系统 调用 gtty 所 读 取 的 数据 


tty.t_erase ~ tty.t_ kill 
a Ue 


表 13-17 系统 调用 gtty 的 参数 


u.u_arg[9] 用 于 存放 所 读 取 的 终端 信息 的 用 户 空 间 地 址 


于 打开 终端 特殊 文件 的 文件 描述 符 


代码 清单 13-15 ”gtty0 《dmr/tty.c) 


tty() 


int v[3]; 
register *up, *vp; 


OO 


Vp = V, 

sgtty(vp); 

If (u.u_error) 
return; 

up = u.u_arg[90]; 

suword(up, *vp++); 

suword(++up, *vp++); 

suword(++up, *vp++); 


1 
2 
3 
4 
5 
6 
7 
8 
9 


7 ”调用 sgtty()， 设 定 其 参数 为 指向 用 于 存放 tty 结构 体 数 据 
的 int[3] 的 指针 。 


8~9 ”如 果 在 执行 sgtty( ) 中 发 生 错 误 则 返回 。 
10~13 ”将 tty 结构 体 的 信息 读 取 至 用 户 空 间 。 
stty() 
stty( ) 为 系统 调用 stty 的 处 理 函 数 ( 表 13-19， 代 码 清单 13-16 
) 。 该 画 数 将 用 户 空 间 的 数据 设 定 到 终端 〈tty 结构 体 ) 。 设 定 的 数 
据 如 表 13-18 所 示 。 


大 部 分 处 理 在 sgtty( ) 中 进行 。 该 函数 为 gqtty() 与 stty( ) 的 共 
用 函数 。 


表 13-18 系统 调用 stty 所 设 定 的 数据 


me 


int[1] tty.t_erase ~、 tty.t_kill 


fF 终端 特殊 文件 的 文件 


空间 中 的 数据 (int[3] ) 的 指针 ， 该 数据 将 被 写 入 tty 结构 


代码 清单 13-16 stty(0 (dmzr/tty.c) 


tty() 


register int *up; 


0 


up = u.u_arg[90]; 
u.u_arg[90] = fuword(up); 


u.u_arg[1] fuword(++up); 
u.u_arg[2] fuword(++up); 
sgtty(0); 


OOOONOORODNDP 


2 
bd 


5~8 u.u_arg[] 中 容纳 用 户 程 序 指定 的 值 。u.u_arg[90] 对 应 
tty.t_speed, u,vu_arg[1] 对 应 tty.t_erase 和 
tty.t_kill, u.u_arg[2] 对 应 tty.t mode 。 


9 ”调用 sgtty()。，。 通 过 将 参数 指定 为 0， 表 示 对 tty 结构 体 进 
行 写 入 处 理 。 


sgtty() 


sgtty() 用 于 执行 stty() 和 gtty() 的 共用 处 理 ( 表 13-20， 代 码 
清单 13-17 ) 。 首 先 取得 与 已 打开 的 特殊 文件 相对 应 的 inode[] 元 
素 ， 并 确认 其 为 字符 设备 。 然 后 将 jnode .i_addr[9] 设 定 为 设备 编 
号 。 最 后 使 用 大 编号 执行 在 cdevsw[].d_sgtty 中 注册 的 
KklLsgtty() 。 


表 13-20 ”sgtty0 的 参数 


| 赋予 cdevSsw[].d_sgtty (klsgtty() ) 


代码 清单 13-17 sgtty0 (dmr/tty.c) 


1 sgtty(v) 

2 int *v; 

3 1 

4 register Struct file *fp; 

5 register struct inode *ip; 

6 

7 if ((fp = getf(u.u_arO[RO])) == NULL) 
8 return; 

9 ip = fp->f_inode; 

10 if ((ip->i mode&IFMT) != IFCHR) { 

11 U.Uu_error = ENOTTY,; 

12 return; 

13 } 

14 (*cdevsw[ip->i_addr[0].d major].d_sgtty)(ip->i addr[90], v); 


| 


7~8 ”由 于 用 户 进 程 的 r9 保存 了 终端 的 文件 描述 符 ， 因 此 执行 
getf( ) 取得 相对 应 的 file[] 元 素 。 


9 ”获取 由 file[] 元 素 所 指 回 的 inode[] 元 素 。 
10~13 如果 ijnode[] 元 素 并 非 字 符 型 的 特殊 文件 则 出 错 。 
14 ”调用 用 于 设 定 终端 的 设备 驱动 。 


klsgtty() 


klsgtty() 为 用 于 设 定 及 读 取 tty 结构 体 的 KL11 设备 驱动 ( 表 13- 
21， 代 码 清 单 13-18 ) 。 根 据 小 编号 从 k111[] 获取 相应 的 tty 结构 
体 ， 并 执行 ttystty() 。 


表 13-21 klsgtty0 的 参数 


0 v) 
int 


tp = &klii[dev.d_ minor]; 


1 
2 
3 
4 register Struct tty *tp; 
5 
6 
7 ttystty(tp, v); 

8 


| 


ttystty() 


ttystty() 是 实际 上 对 tty 结构 体 进 行 写 入 或 读 取 处 理 的 函数 ( 表 
13-22， 代 码 清单 13-19 ) 。 该 函数 由 设备 驱动 调用 。 参 数 av 为 0 时 进 


行 写 入 ， 其 他 值 时 进行 读 取 。 


表 13-22 ttystty0 的 参数 


指向 tty 结构 体 的 指针 


0: 将 u.u_arg[] 中 的 数据 赋予 tty 结构 体 。 处 理 结束 时 返回 0。 


0 以 外 : 将 tty 结构 体 的 数据 读 取 至 


1 ttystty(atp, av) 
2 int *atp, *av; 


3 1 

4 register *tp, *v; 

5 

6 tp = atp， 

7 if(v = av) { 

8 *V++ = tp->t_speeds; 

9 VvV->lobyte = tp->t_erase 
10 V->hibyte = tp->t_kill; 
11 v[1] = tp->t_flags; 

12 return(1); 

13 } 

14 wflushtty(tp); 

15 VvV= U.u_arg; 

16 tp->t_speeds = *vVv++; 

17 tp->t_erase = v->lobyte,; 
18 tp->t_kill = v->hibyte; 


19 tp->t_flags = v[1]; 


由 av 所 示 的 地 址 。 处 理 结束 时 返回 1 


了 


20 return(0); 
} 


7~13 ” 读 取 tty 结构 体 的 处 理 。lobyte 和 hibyte 是 为 了 访问 
2 字 下 数据 的 低位 字 节 和 高 位 字 节 而 定义 的 结构 体 的 成 员 变量 ( 代 
码 清单 13-20) 。 


代码 清单 13-20 lobyte 和 hibyte (param.h) 


struct 


char lobyte; 
char hibyte; 
}; 


14~20 ”对 tty 结构 体 进行 写 入 的 处 理 。 首 先 执行 
wflushtty() 清空 队列 。 


13.4 ”从 终端 输入 文字 


从 终端 输入 文字 时 的 处 理 如 下 所 示 (图 13-6) 。 


内 核 


司 边 设备 


别 


tty.t_rawq tty.t_canqg 


输入 终端 《1 ) 


rr EE 


专 


断 


中 
i 
2 
= 
一 
一 人 


图 13-6 从 终端 输入 文字 

1. 从 终端 输入 数据 后 ， 数 据 将 被 赋予 KL11/DL11 的 输入 寄存 器 

2. KL11/DL11 的 寄存 器 设 定 了 数据 后 将 引发 中 断 

3. 中 断 处 理 函 数 从 KL1VDL11 的 输入 寄存 旭 读 取 数 据 ， 对 其 进行 适当 
的 变换 ， 并 对 特殊 文字 及 分 隔 符 进 行 处 理 ， 然 后 将 数据 追加 至 tty .t 
_ rawq 

在 3. 的 处 理 中 ， 为 了 避免 在 向 tty,t_rawd 追加 数据 时 缓冲 区 发 生 洲 
出 的 问题 ， 当 tty,t_rawd 中 的 数据 达到 TTYHOG (代码 清单 13-21 
) 件 时 ， 队 列 将 被 清空 。 

代码 清单 13-21 TTYHOG (tty.h) 


1 #define TTYHOG 256 


klrint() 

klrint() 为 中 断 处 理 函 数 ， 用 于 人 处理 从 终端 输入 数据 时 发 生 的 中 断 
( 表 13-23， 代 码 清音 13-22 ) 。 首 先 根据 小 编号 从 kil11[] 取得 相应 

的 tty 结构 体 ， 同 时 从 KL11 的 输入 寄存 器 中 获取 输入 的 数据 。 


设置 输入 控制 寄存 器 ， 使 其 处 于 可 接收 状态 ， 然 后 执行 ttyinput() 
将 输入 的 数据 奶 加 至 tty.t_rawq 。 


表 13-23 klrint0 的 参数 


代码 清单 13-22 klrint0 (dmr/kl.c) 


lrint(dev) 


k 


register int c, *addr; 
register struct tty *tp; 


tp = &kl1ii[dev.d_ minor]; 

addr = tp->t_addr; 

c = addr->klrbuf; 

addr->klrcsr =| RDRENB， 

if ((c&0177)==0) 
addr->kltbuf = c; 

ttyinput(c, tp); 


10~11 ”如 琳 接 收 的 数据 为 空 ， 则 将 输出 数据 寄存 右 设 置 为 接收 结 
果 。 这 是 为 了 保险 起 见 而 进行 的 处 理 。 


ttyinput() 


因 终 端 输入 引发 中 断 的 处 理 函 数 将 调用 ttyinput() ( 表 13-24， 代 
码 清单 13-23 ) 。 该 函数 将 数据 追加 至 tty,t_rawq“。 


此 处 将 进行 下 面 这 些 特殊 处 理 。 
8 CR 模式 时 ， 将 2? 变 为 \n” 


。 在 RAW 以 外 的 模式 时 ， 如 果 输 入 了 FS 和 DEL， 则 将 该 终端 控制 
的 所 有 进程 发 送 SIGQIT (FS 时) 或 SIGINT (DEL 时 ) 信号 


。 如 果 tty.t_rawgq 你 存 的 数据 件数 大 于 等 于 TTYHOG 时 ， 将 清空 
全 部 3 个 队列 


如 采 终 端 只 能 处 理 大 写 文字 时 ， 将 输入 的 大 写 文 字 变 为 小 写 文字 


RAW 模式 ， 或 输入 了 换行 符 或 EOT 时 ， 在 输入 文字 后 追加 分 隔 
符 (0377) ， 并 将 其 追加 至 tty.t_rawq ， 同 时 递增 分 隅 符 计 数 


器 的 值 
。ECHO 模式 时 ， 将 输入 的 文字 输出 至 终端 
表 13-24 ttyinput0 的 参数 


输入 文字 (8 比特 ASCII 码 ) 


atp tty 结构 体 


代码 清单 13-23 ttyinput0 (dmr/tty.c) 


1 ttyinput(ac, atp) 
2 struct tty *atp; 


3 1 

4 register int t_flags, c; 

5 register struct tty *tp; 

6 

7 tp = atp; 

8 c= ac; 

9 t_flags = tp->t_flags; 

10 if ((c =& 0177) == '\r' && t_flags&CRMOD) 
11 c= '\n'; 

12 if ((t_flags&RAW)==0 && (c==CQUIT || c==CINTR)) { 
13 signal(tp, c==CINTR? SIGINT:SIGQIT); 
14 flushtty(tp); 

15 return; 
16 } 
17 If (tp->t_rawq.c_cc>=TTYHOG) { 
18 flushtty(tp); 
19 return; 
20 
21 If (t_flags&LCASE && c>='A' && c<='Z') 
22 C 三 十 Ta 1A' ; 
23 putc(c, &tp->t_rawq); 
24 If (t_flags&RAW || c=='\n' || c==004) { 
25 wakeup(&tp->t_rawq); 
26 If (putc(0377, &tp->t_rawdq)==0) 
27 tp->t_delct++; 


29 if (t_flags&ECHO) { 


30 ttyoutput(c, tp); 
31 ttstart(tp); 

32 

33 } 


10~11 ”CR 模式 时 的 处 理 。 
12~16 ”发 送信 号 的 处 理 。 
17~20 ”如果 tty.t_rawq 中 你 存 的 数据 过 多 ， 则 将 3 个 队列 全 


部 清 守 oO 


21~22 ”如果 终 端 只 能 处 理 大 写 文 字 ， 则 将 输入 的 大 写 文 字 变 为 小 
写 文字 。 


23 ”使 用 putc() 将 输入 的 文字 追加 至 tty,t_rawq。 
24~28 “对 分 隔 符 的 处 理 。 
29~32 ECHO 模式 时 的 处 理 。 


13.5 ” 读 取 输入 的 数据 


将 输入 的 数据 读 取 至 用 户 空 间 的 流程 如 下 所 示 (图 13-7) 。 


内 核 


(2) 


tty.t_rawq tty.t_cand 


输入 终端 中 断 


图 13-7 读 取 输入 的 数据 

1. 用 户 程序 对 终端 执行 系统 调用 read 

2. 从 tty.t _ rawq 读 取 数据 ， 将 其 退 加 人 至 tty.t _ canq ， 同 时 
对 下 列 特 殊 文字 进行 处 理 : 删除 1 个 文字 (#) ， 删 除 1 行文 字 (@) ， 
转 义 处 理 (/) 。 将 输入 数据 从 tty.t rawd 转 存 到 tty,t _ 
cangq 直至 遇 到 分 隔 符 


cand 数据 读 取 至 用 户 空 间 


3. 将 tty.t _ 
klread() 
klread( ) 是 将 从 终端 输入 的 数据 读 取 至 用 户 空 间 的 设备 张 动 函数 
( 表 13-25， 代 码 清单 13-24 ) 。 对 终端 的 特殊 文件 执行 系统 调用 
read 后 ， 将 执行 在 cdevsw[] ,d_read 中 注册 的 kliread()。 
根据 小 编号 从 KL11[] 取得 相应 的 tty 结构 体 ， 并 执行 ttread() 。 


表 13-25 ”klread0 的 参数 


代码 清单 13-24 klread() (dmr/kl.o) 


1 klread(dev) 

2 

3 ttread(&kl1ii[dev.d_ minor]); 
4 } 


ttread() 


ttread() 在 read 时 由 设备 驱动 调用 〈 表 13-26， 代 码 清单 13-25 

) 。 首 先 检 查 是 否 已 打开 终端 ， 然 后 执行 canon( ) 将 数据 从 
tty.t_rawdq 传送 至 tty.t_canq ， 再 从 tty,t_cand 向 用 户 空间 
传送 数据 。 


表 13-26 ”ttread0 的 参数 


ttread(atp ) 
Struct tty *atp; 


{ 
register struct tty *tp; 


tp = atp; 
if ((tp->t_state&CARR_ON)==0) 
return; 


If (tp->t_canq.c_cc || canon(tp)) 
while (tp->t_cangq.c_ cc && passc(getc(&tp->t_candgq))>=0); 


7~8 ”如 末末 打开 终端 则 不 作 任 何 处 理 直 接 返回 。 


9~10 “如果 tty.t_cangq 中 残留 了 数据 ， 或 是 canon( ) 的 结果 
9 ， 则 使 用 passc() 回 用 户 空间 传送 tty,t_cand 中 的 数 
= 


canon() 


canon( ) 用 于 从 tty.t_rawq 向 tty.t_cang 传送 数据 ( 表 13- 
27， 代 码 清单 13-28 ) 。 如 果 向 tty.t_cangq 成 功 追 加 了 数据 则 返回 


1 。 


处 理 时 使 用 canonb[] 作为 工作 区 域 (代码 清单 13-26， 代 码 清单 13- 
27 ) 。 从 tty.t_rawg 的 起 点 开始 将 数据 转 存 至 canonb[] 直至 遇 
到 分 隔 符 (0377 ) ， 然 后 在 进行 删除 1 个 文字 、 删 除 1 行文 字 和 转 义 
处 理 的 同时 ， 再 将 数据 追加 至 tty,t_canq (图 13-8 ) 


队列 的 起 点 。 二 一 一 一 一 tty.t_rawq 


处 理 单位 处 理 单位 


canonb[ ] 


< tty.t_cang 
一 一 一 一 一 > 队列 的 起 点 


图 13-8 canon() 


bp 是 canonb[] 中 的 工作 指针 ， 当 bp 之 前 的 文字 为 “时 ， 利 用 
maptab[] 进行 转 义 处 理 。 但 是 如 果 bp 之 前 的 倒数 第 2 个 文字 也 
为 “时 ， 则 认为 “^* 是 已 经 转 义 过 的 文字 。 


当 从 tty.t_rawd 获取 的 文字 为 用 于 删除 1 个 文字 的 特殊 文字 时 ， 将 
bp 向 前 移动 1 个 文字 的 位 置 。 当 为 用 于 删除 1 行文 字 的 特殊 文字 时 ， 
将 bp 移动 至 作为 处 理 起 点 的 &canonb[2] (图 13-9) 。 


Ot 


但 是 如 果 bp 之 前 倒数 第 2 
个 文字 也 为 \， 则 认为 倒 
数 第 1 个 文字 的 \ 为 经 过 
转 义 处 理 的 文字 


canonb[ ] 
3 


4 5 6 7 
加 辣 二 区 丽 区 加 胸 、 


bp 


如 果 bp 之 前 的 文字 为 \ 则 进 
行 转 义 处 理 


----- 区 


canonb[] 


研一 一 
bp 
删除 1 行文 字 时 需要 将 删除 1 个 文字 时 将 
bp 移动 至 &canonb[2] bp 前 移 一 个 位 置 


图 13-9 ”canonb[] 的 处 理 


代码 清单 13-26 canonb (system.h) 


1 char canonb[CANBSIZ]; 


代码 清单 13-27 CANBSIZ (param.h) 


1 #define CANBSIZ 256 


表 13-27 canon( 的 参数 


工 
2 
3 


canon(atp ) 
struct tty *atp; 
{ 
register char *bp; 
char *bp1; 
register struct tty *tp; 
register int c; 


tp = atp; 
spl5(); 
while (tp->t_ delct==0) { 
if ((tp->t_state&CARR ON)==0) 
return(0); 
sleep(&tp->t_rawq, TTIPRI); 


sp10(); 
loop: 
bp = &canonb[2]; 
while ((c=getc(&tp->t_rawq)) >= 0) { 
if (c==0377) { 
tp->t_delct--; 
break; 


} 
if ((tp->t_flags&RAW)==0) { 
if (bp[-1]!='\\') { 
if (c==tp->t_erase) { 
If (bp > &canonb[2]) 
bp--; 
continue; 


} 
if (c==tp->t_kill) 
goto loop; 
if (c==CEOT) 
continue; 
} else 
if (maptab[c] && (maptab[c]==c || (tp- 


>t_flags&LCASE))) { 


37 if (bp[-2] != '\\') 
38 c = maptab[c]; 
39 bp--; 

40 

41 } 

42 *bp++ = Cc; 

43 if (bp>=canonb+CANBSIZ) 

44 break; 

45 } 

46 bp1 = bp; 

47 bp = &canonb[2]; 

48 c = &tp->t_cang; 

49 while (bp<bp1) 

50 putc(*bp++, c); 

51 return(1); 

52 } 


10~16 ”如果 tty.t_rawg 中 的 数据 不 包含 分 隅 符 ， 且 终端 处 于 


未 打开 状态 ， 则 返回 0。 人 否则 进入 睡眠 状态 ， 直 到 分 隅 符 被 追加 至 
tty.t_rawq ° 


18 将 bp 设 定 为 处 理 起 点 &canonb[2] 。 


19 ”以 文字 为 单位 从 tty.t_rawq 中 获取 数据 ， 并 将 其 追加 至 
canonb[] ， 直 至 遇 到 分 隅 符 。 


20~23 ” 遇 到 分 隔 符 时 ， 递 减 分 隔 符 计 数 需 并 退出 循环 。 

24~41 “如果 不 为 RAW 模式 ， 且 bp 之 前 的 文字 为 “时 ， 根 据 
maptab[ ] 进行 转 义 处 理 。 但 是 如 果 bp 之 前 倒数 第 2 个 文字 也 
为 A*Y， 则 认为 bp 之 前 的 “为 已 经 经 过 转 义 的 文字 。 

bp 之 前 的 文字 不 为 人 时， 进行 下 述 处 理 。 


。 删除 1 个 文字 时 将 bp 前 移 1 位， 但 不 会 移动 至 小 于 
&canonb[2] 的 位 置 


。 删除 1 行文 字 时 返回 loop 处 (基本 等 同 于 将 bp 前 移 至 
&canonb[2] ) 


。 如 果 为 EOT 时 继续 处 理 下 一 个 文字 
42 “将 文字 追加 至 canonb[] 。 
43~44 ”如 果 canonb[] 已 无 空间 ， 则 退出 循环 。 


46~50 ”将 &canonb[2] 至 bp 所 对 应 范围 的 数据 追加 至 
tty,t_candq。 


51 ”如 果 canon( ) 的 处 理 正常 结束 则 返回 1。 
13.6” 回 终端 输出 数据 
向 终端 输出 数据 的 流程 如 下 所 示 (图 13-10) 。 


周边 设备 内 核 


tty.t_outq 


a | 


设备 驱动 


writel() 
用 户 空 间 


图 13-10 ”向 终端 输出 数据 
1. 用 户 程 序 对 终端 执行 系统 调用 write 
2. 用 户 空间 的 数据 被 追加 至 tty.t _ outq 


3. 将 位 于 tty.t 。 outq 起 始 位 置 的 数据 赋予 KL11 寄 存 器 ， 开 始 癌 
终端 输出 数据 


4. 当 回 终端 输出 数据 的 处 理 结束 后 ，KL11 将 引发 中 断 。 如 果 tty.,t _ 
outq 中 残留 了 数据 ， 中 断 处 理 函 数 将 继续 进行 输出 处 理 


当 上 述 2 中 向 tty,t_outq 追加 数据 时 ， 会 根据 终端 的 设置 对 输出 文 
宇 进 行 委 换 (例如 ， 当 终端 只 能 处 理 大 写 文字 时 ， 将 小 写 文字 变 为 大 
写 文字 ) 。 


在 处 理 一 部 分 特殊 文字 时 会 花费 较 长 时 间 〈 例 如 会 发 生 移动 打印 头 的 
处 理 ) 。 因 此 ， 设 备 驱 动 在 此 类 处 理 结束 前 将 延迟 输出 处 理 。 在 2 中 
向 tty.t_outq 追加 数据 上 时， 如 果 数 据 为 特殊 文字 ， 则 将 额外 向 
tty.t_outq 追加 1 字 节 长 的 数据 (如 表 13-28 所 示 ) 。 在 3 的 处 理 
中 将 tty,t_outd 的 数据 赋予 KL11 寄存 器 时 ， 如 果 从 tty.t_outq 
中 取得 的 1 字 市 长 的 数据 的 最 高 比特 位 为 1， 则 执行 timeout( ) 并 在 
指定 tick 发 生 后 再 继续 进行 输出 处 理 。 在 此 延迟 处 理 过 程 中 ,为 tty 
结构 体 设置 TIMEOUT 标志 位 。 


表 13-28 ”延迟 指示 数据 


Wa 


6~0 延迟 时 间 (tick) 


为 了 避免 tty .t_outq 中 保存 太 多 数据 ， 定 义 了 TTHIWAT (High 
water mark) 和 TTLOWAT (Low water mark) (代码 清单 13-29) 。 
在 2 中 向 tty,t_outd 追加 数据 时 ， 如 果 队 列 中 的 数据 件数 (文字 
数 ) 超过 了 TTHIWAT ， 则 在 向 tty .t_outq 追加 数据 前 ， 首 先 执行 
上 述 3 的 处 理 以 同 终端 输出 文字 ， 然 后 进入 睡眠 状态 。 当 
tty.t_outd 中 的 数据 件数 (了 文字数) 通过 同 终 端 输出 数据 变 为 
TTLOWAT 时 ， 处 于 睡眠 状态 的 进程 被 唤醒 ， 并 将 继续 向 tty.t_outq 
追加 数据 。 


代码 清单 13-29 TTHIWAT 和 TILOWAT (tty.h) 


1 #define TTHIWAT 50 
2 #define TTLOWAT 30 


klwrite() 

klwrite() 是 用 于 向 终端 进行 输出 的 设备 驱动 函数 ( 表 13-29， 代 码 
清单 13-30 ) 。 在 对 终端 的 特殊 文件 执行 系统 调用 write 后 ， 将 会 调 
用 在 cdevsw[].d_write 中 注册 的 klwrite()。 


根据 小 编号 从 kL11[] 获取 相应 的 tty 结构 体 ， 并 执行 ttwrite() 


表 13-29 ”klwrite( 的 参数 


代码 清单 13-30 klwrite0 (dmr/kl.o) 


lwrite(dev) 


全 类 
2 
3 ttwrite(&klii[dev.d minor]); 
4 } 


ttwrite() 


ttwrite( ) 为 终端 共用 处 理 函 数 ， 由 设备 驱动 在 向 终端 进行 输出 时 调 
用 ( 表 13-30， 代 码 清单 13-31 ) 。 


首先 执行 ttyoutput() ， 将 用 户 程序 指定 的 数据 全 部 追加 至 
tty.t_outq ， 然 后 执行 ttstart() 开始 向 终端 进行 输出 。 


但 是 ， 如 果 tty.t_outq 中 保存 了 过 多 的 数据 ， 需 要 先 将 其 输出 至 终 
端 以 腾空 tty.t_outq 。 


表 13-30 ttwrite() 的 参数 


含义 


tty 结构 体 


1 ttwrite(atp) 
2 struct tty *atp; 


register struct tty *tp; 
register int c; 


tp = atp; 
if ((tp->t_state&CARR ON)==0) 
return; 
while ((c=cpass( ))>=0) { 
Sp15() ， 
while (tp->t_outq.c_cc > TTHIWAT) { 
ttstart(tp); 
tp->t_state =| ASLEEP; 
sleep(&tp->t_outq, TTOPRI); 


sp19( ); 
ttyoutput(c, tp); 


ttstart(tp); 


8~9 ”如 果 终 端 处 于 未 打开 的 状态 则 不 做 任何 处 理 立 即 返 回 。 


10 “对 用 户 程序 传送 的 数据 进行 逐 字 处 理 。 


12~16 “如果 tty.t_outq 中 保存 了 超过 TTHIWAT 的 数据 ， 执 
行 ttstart() 促使 系统 进行 输出 处 理 ， 同 时 设置 ASLEEP 标志 
位 进入 睡眠 状态 。 当 tty,t_outd 中 的 数据 减少 至 TTLOWAT 
虽 终端 输出 结束 并 引发 中 断 ， 进 程 将 被 该 中 断 的 处 理 函 数 唤 
星 o 

18 ”执行 ttyoutput()， 将 数据 逐 字 追加 至 tty.t_outq。 


20 ”执行 ttstart() 开始 癌 终 端 进行 输出 。 
ttyoutput() 


ttyoutput() 用 于 向 tty.t_outq 追加 1 个 文字 ( 表 13-31， 代 码 
清单 13-32 ) 。 该 函数 执行 下 述 特殊 处 理 。 


。 如 采 不 处 于 RAW 模式 ， 且 当前 文字 为 EOT 时 ， 不 进行 追加 处 
理 。 


。 如 采 处 于 XTABS 模式 ， 且 当前 文字 为 Wt* 时 ， 输 出 空 日 使 打印 头 
移动 至 以 8 个 文字 为 间距 的 下 一 个 位 置 。 


。 如 条 终端 只 能 处 理 大 写 文 字 ， 则 将 小 写 文字 变 为 大 写 文 字 ， 并 将 
终 吊 无 法 处 理 的 符号 变 为 肥 斜 线 和 终 剖 能够 处 理 的 符号 的 组 合 。 


。 CR 模式 时 将 An” 变 为 rn”。 
此 外 ， 当 特殊 处 理 导 致 处 理 时 间 变 长 时 ， 同 tty .t_outq 追加 额外 的 
1 字 节 数据 ， 表 示 进 行 输出 延迟 处 理 。 特 殊 处 理 通过 相应 的 partab [ ] 
元 素 的 低位 比特 进行 判断 。 


表 13-31 ttyoutput(0 的 参数 


代码 清单 13-32 ttyoutput(0 (dmmtty.a 


1 ttyoutput(ac, tp) 
2 struct tty *tp; 


3 1 

4 register int c; 

5 register struct tty *rtp; 

6 register char *colp; 

7 int ctype; 

8 

9 rtp = tp; 
10 C = ac&0177; 
11 if (c==004 && (rtp->t_flags&RAW)==0) 
12 return; 
13 if (c=='\t' && rtp->t_flags&XTABS) { 
14 do 
15 ttyoutput(' ', rtp); 
16 while (rtp->t_col&07); 
17 return; 
18 } 
19 If (rtp->t_flags&LCASE) { 
20 colp = "({)}!1^~" "; 

21 while(*colp++) 

22 if(c == *colp++) 区 

23 ttyoutput('\\', rtp); 
24 c= colp[-2]; 

25 break; 

26 } 

27 If ('a'<=c && c<='z"') 

28 C=+ 'A' - "ai 

29 } 

30 if (c=='\n' && rtp->t_flags&CRMOD) 
31 ttyoutput('\r', rtp); 

32 If (putc(c, &rtp->t_outq)) 

33 return; 

34 colp = &rtp->t_col; 

35 ctype = partab[c]; 

36 c= 0; 

37 Switch (ctype&077) { 


/* 一 般 处 理 */ 
case 0: 
(*colp)++; 


/* 不 做 显示 */ 
case 1: 
break; 


/* 删除 之 前 的 1 个 文字 */ 
case 2: 
if (*colp) 
(“colp)--; 
break; 


/* 换行 */ 
case 3: 
ctype = (rtp->t_flags >> 8) & 03; 
if(ctype == 1) { 
if (*colp) 
C = max((*colp>>4) + 3, 6); 
} else 
if(ctype == 2) { 
c= 6; 
} 


*colp = 0; 
break; 


/* 水 平 制 表 符 */ 
case 4: 
ctype = (rtp->t_flags >> 10) & 03; 
if(ctype == 1) { 
c=1- (*colp | ~07); 
if(c < 5) 
C = 0; 


*colp =| 07; 
(“colp)++; 
break; 


/* 垂直 方向 的 处 理 */ 
case 5: 
if(rtp->t_flags & VTDELAY) 
c = 0177; 
break; 


/* CR */ 
case 6: 
ctype = (rtp->t flags >> 12) & 03; 
if(ctype == 1) { 
C= 5; 
} else 


32~33 


if(ctype == 2) { 
C = 10; 


了 


} 
*colp = 0; 


} 
95 if(c) 


putc(c|0200, &rtp->t_outq); 


对 EOT 的 处 理 。 

XTABS 模式 时 的 处 理 。 

当 终端 只 能 处 理 大 写 文字 时 的 处 理 。 

CR 模式 时 的 处 理 。 将 “首先 追加 至 tty.t_outq 。 


向 tty.t_outq 追 加 1 个 文字 。 


35 ”从 此 处 开始 为 输出 延迟 判断 处 理 。 如 采 需 要 的 话 调整 代表 打 

印 头 水 平 位 置 的 tty.t_col ,向 tty.t_outq 追加 额外 的 1 字 
廊 数 据 ， 表 示 进 行 输出 延迟 尺 处 理 (参照 表 13-32) 。 根 据 

Ei t_flags 的 值 不 同 ， 延 迟 时 间 也 有 可 能 发 生变 化 。 具 体 请 参 
见 UPM(2) 中 天 于 系统 调用 stty 的 说 明 。 


表 13-32 ”延迟 时 间 和 tty.t_col 的 位 置 


含义 |tty.t_col 延迟 时 间 


- 换行 类 型 为 1 时 ， 根 据 当前 打印 头 在 又 方 向 的 位 置 


删除 之 
前 的 1 
个 文字 


选择 在 X/16+3 和 6 中 较 大 的 值 。 换 行 类 型 为 2 时 设 
定 延迟 时 间 为 6， 此 外 为 0 


8 水 平 制 表 符 类 型 为 1 时 ， 根 据 当前 打印 头 的 位 置 与 8 
4 数 的 倍数 之 间 的 兰 值 ， 所 得 到 的 值 也 有 所 不 同 。 如 采 产 
值 大 于 等 于 5 则 为 该 差 值 ， 否 则 为 0 
= 如 有 果 秋 直方 向 的 处 理会 导致 延迟 ， 则 将 延迟 时 间 设 定 
为 0177 (延迟 时 间 最 大 值 ， ， 否 则 为 0 


CR 类 型 为 1 时 将 延迟 时 间 设 定 为 5，CR 类 型 为 2 时 
设 定 为 10， 此 外 为 0 


ttstart() 


ttstart() 定向 终端 进行 输出 的 函数 ( 表 13-33， 代 码 清单 13-33 
) 


如 果 输 出 的 1 字 节 数据 的 最 高 位 比特 为 1， 则 进行 输出 延迟 处 理 。 
表 13-33 ttstart( 的 参数 


tty 结构 体 


代码 清单 13-33 ttstart() (dmr/tty.c) 


1 ttstart(atp) 
2 struct tty *atp; 


3 1 


register int *addr, c; 
register struct tty *tp; 
struct { int (*func)(); }; 


tp = atp; 

addr = tp->t_addr; 

if (tp->t_state&SSTART) { 
(*addr.func)(tp); 
return; 


} 
if ((addr->tttcsr&DONE)==0 || tp->t_state&TIMEOUT) 
return; 
if ((c=getc(&tp->t_outq)) >= 0) { 
If (c<=0177) 
addr->tttbuf = c | (partab[c]&0200); 
else { 
timeout(ttrstrt, tp, c&0177); 
tp->t_state =| TIMEOUT ， 


10~13 ”与 KL11DL11 无 关 的 处 理 。 在 一 部 分 终端 接口 中 使 用 。 
14~15 ”如 果 终 端 处 于 发 送 处 理 或 发 送 延迟 处 理 中 则 返回 。 
tttcsr 是 为 了 操作 终端 接口 的 发 送 状态 寄存 器 而 定义 的 结构 体 的 
成 员 变 量 (代码 清单 13-34) 。 


代码 清单 13-34 ”用 于 操作 接 # 寄 存 器 的 结构 体 《dmxr/tty.o) 


1 struct { 

2 int ttrcsr; 
3 int ttrbuf; 
4 int tttcsr; 
5 

6 


int tttbuf; 
}; 


| 


16~22 如果 tty.t_outq 中 存在 数据 ， 首 先 从 队列 的 头 部 取得 

1 个 文字 。 如 有 果 所 取得 的 1 子 廊 数据 包含 7 比特 信息 则 判断 其 为 
(7 比特 的 ) ASCII 码 ， 将 偶 校 验 位 追加 至 最 高 位 比特 ， 并 将 该 数 

据 赋予 终 咒 接口 的 发 送 数据 寄存 紫 。 当 设置 了 发 送 数 据 寄存 胡 

后 ， 终 端 输出 处 理 将 被 司 动 。 


最 高 位 比特 为 1 时 表示 需要 进行 延迟 处 理 。 在 执行 timeout() 
并 经 过 由 所 取得 数据 的 低位 7 比特 所 示 的 tick 数 后 ， 执 行 
ttrstrt()。tty 结构 体内 表示 设置 了 正在 进行 延迟 处 理 的 
TIMEOUT 标志 位 。 


ttrstrt() 


ttrstrt() 由 ttstart() 注册 至 callout[] ， 在 所 设 定 的 时 刻 由 
clock( ) 进行 调用 ( 表 13-34， 代 码 清单 13-35 ) 。 当 解除 了 
TIMEOUT 状态 后 ， 该 函数 将 执行 ttstart( ) 继续 进行 输出 处 理 。 


表 13-34 ttrstrt0 的 参数 


tty 结构 体 


1 ttrstrt(atp) 

2 

3 register struct tty *tp; 
4 

5 tp = atp; 

6 tp->t_state =& ~TIMEOUT ， 
7 ttstart(tp); 

8 } 


| 


klxint() 

klxint() 为 终端 输出 处 理 结束 后 引发 中 断 的 处 理 函 数 ( 表 13-35， 代 
码 清单 13-36 ) 。 根 据 小 编号 从 kL11[] 获取 相应 的 tty 结构 体 ， 并 
执行 ttstart() 继续 终端 的 输出 处 理 。 


表 13-35 klxint0 的 参数 


代码 清单 13-36 klxint() (dmr/kl.o) 


klxint(dev) 
{ 
register struct tty *tp; 


ttstart(tp); 


If (tp->t_outq.c_ cc == 0 || tp->t_outq.c_cc == TTLOWAT) 
wakeup(&tp->t_outq); 


1 
2 
3 
4 
5 tp = &kl1ii[dev.d_ minor]; 
6 
7 
8 
9 


} 


6 执行 ttstart()， 如 果 tty.t_outq 中 残留 了 数据 ， 则 继 
续 回 终端 输出 文字 。 


7~8 ”如 果 tty.t_outq 中 不 再 有 数据 ， 或 者 已 使 用 了 一 部 分 
时 ， 唤 醒 正 在 等 待 tty,t_outd 中 的 数据 被 消耗 的 进程 。 


13.7 ”小结 


内 核 担 供 了 对 电 传 终端 处 理 的 文 持 。 

系统 用 户 通 过 电 传 终端 与 系统 进行 交流 。 

少 存在 1 人 台 供 系统 操作 全 使 用 的 终端 。 

位 用 户 可 以 使 用 多 台 终 端 同时 操作 系统 。 

器具 有 3 个 缓冲 区 队列 ， 在 系统 与 终端 间 适 当 变 换 数据 并 传 


池 


汇演 以 
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人 
。 在 内 核 未 运行 , 且 无 法 进行 文件 操作 的 情况 下 ,如 何 将 内 核 程 序 读 取 
至 内 存 
。 虚拟 地 K 空 间 如 何 从 无 效 状态 迁移 至 有 效 状态 

通过 阅读 本 部 分 的 内 容 ,读者 将 会 了 解 系统 是 如 何 进 入 可 执行 状态 的 。 


第 14 章 启动 系统 
14.1 启动 的 流程 


UNIX V6 的 启动 流程 如 下 所 示 (图 14-1) 。 


1. 保存 在 ROM 中 的 引导 装 入 程序 ， 将 位 于 根 磁盘 块 编号 0 处 的 引导 程 
序 读 取 至 内 存 地 址 0 的 位 置 并 执行 。 


2. 引导 程序 从 根 磁盘 的 文件 系统 将 /unix、/rkunix 等 内 核 程序 的 主 
程序 读 取 至 内 存 地 址 0 的 位 置 并 执行 。 


3. 内 核对 系统 进行 初始 化 。 
ROM 内 存 ”物理 地 址 


引导 装 入 程序 
0 


根 磁 盘 


0 | 引导 程序 


文件 系统 


巩 


/unix 内 核 程序 主 程 
/rkunix 


图 14-1 启动 的 流程 


为 了 局 动 系统 需要 将 内 核 程序 读 取 至 内 存 ， 但 是 内 核 程 序 约 有 40KB， 
这 对 (当时 ) 容量 很 小 的 ROM 而 言 是 无 法 接受 的 。 因 此 ， 需 要 首先 执 
行 可 以 容纳 在 ROM 中 的 简单 程序 ， 再 读 取 较 大 较 复杂 的 引导 程序 .……. 
如 此 逐步 读 取 容 量 较 大 的 程序 。 


系统 管理 者 在 执行 /etc/mkfs 构筑 文件 系统 时 ， 将 引导 程序 放置 于 
块 设备 编号 为 0 的 块 中 。 


代码 清单 14-1 给 出 的 是 位 于 内 核 主 程序 低位 地 址 处 的 代码 。 第 1 行 的 
.= 0^, 表示 当 程 序 被 读 取 至 内 存 时 ， 此 处 为 地 址 0 的 位 置 。 首 先 执 
行 的 指令 是 第 2 行 的 br 1f 。br 为 分 文 〈 跳 转 ) 指令 ，1f 表示 跳 转 


至 前 方 第 1 个 标签 的 位 置 。 跳 转 至 标签 后 执行 jmp start ， 将 控制 
权 转 交 给 start 。 


代码 清单 14-1 启动 (low.s) 


， 二 40^， 

.globl start, dump 
1: jmp start 
jmp dump 


下 二 
2 
3 
4 
5 
6 
7 
8 
9 
0 


1 


start 
start (代码 清单 14-2 ) 进行 下 述 处 理 。 

。 对 内 核 APR 进行 初始 化 

。 激活 MMU 使 之 有 效 

。 执 行 main() 
执行 start 时 尚未 激活 MMU， 处 于 需要 直接 人 处理 物理 地 址 的 状态 。 
内 核 可 以 使 用 16 比特 的 数据 (地 址 ) ， 但 物理 地 址 为 18 比特 ， 因 此 
只 能 访问 物理 地 址 的 低位 16 比特 的 区 域 (0~0177777 ) 。 此 外 ，PSW 
的 当前 模式 为 内 核 模 式 (00 ) 。 


start 首先 进行 内 核 空间 的 设 定 。 对 内 核 APR 进行 如 表 14-1， 图 14- 
2 所 示 的 设 定 。 


。 APR0~5 被 赋予 物理 地 址 0~0137777 的 区 域 。 此 区 域 的 物理 地 址 = 
虚拟 地 址 ， 内 核 程序 被 置 于 该 区 域 的 起 始 位 置 。 


。 APR6 被 赋予 位 于 内 核 程 序 后 方 长 度 为 1KB 的 区 域 。 此 区 域 被 分 
配给 proc[0] 的 PPDA (user 结构 体 和 内 核 栈 ) 。APR6 表示 执 
2 PPDA， 当 执行 进程 发 生 切 换 时 ，PAR6 的 值 也 将 发 生 切 


。 APR7 被 赋予 物理 地 址 的 最 高 位 地 址 0760000~0777777。 此 区 域 被 
分 配给 PDP-11/40 及 周边 设备 的 寄存 絮 。 内 核 通过 控 作 此 区 域 的 
内 存 ， 对 PDP-11/40 及 周边 设备 进行 操作 。 

。 栈 指针 被 设 定 为 指向 APR6 对 应 区 域 的 末尾 。 


A 六 APR 中 ， 除 了 PAR6 以 外 ， 在 系统 运行 时 ， 值 是 不 会 发 生变 化 


表 14-1 内 核 APR 的 初始 设 定 


RW，128 个 
077406 | 0~017777 0~017777 块 (以 64 字 
六 为 单位 ) 
国 区 077406 |020000~037777 ”|020000~037777 | 块 ”， 128 个 
个 
加 077406 | 040000~057777 ”|040000~057777 | 块 ” | 


个 
国 忆 077406 | 060000~077777 |060000~077777 | 
个 
二 区 077406 | 0100000~0117777 | 0100000~0117777 Se F280] 
个 
时 芭 077406 | 0120000~0137777 |0120000~0137777 | 名 


007406 | 0140000~0141777 RW，16 个 


与 内 核 主 程序 块 ， 供 执行 
的 长 度 相 关 程序 的 PPDA 


使 用 


me 077406 | 0160000~0177777 | 0760000~0777777 | 块 ， 供 WO 使 


物理 内 存 物理 地 址 虚拟 地 址 


0 0 
内 核 APR 
0 _etext 
1 
- _edata 
3 
4 
5 _end 
6 DT (137777 
7 0 
proc[0] 的 PPDA 之 后 
的 部 分 作为 空闲 区 域 
注册 到 coremap 
0760000 0160000 
U7A777 他 7 
| user | 
内 核 栈 区 域 
sp —> 


图 14-2 内 核 内 存 空间 


然后 ， 设 置 SR0， 激 活 MMU 使 之 有 效 。 从 此 时 开始 ， 可 将 虚拟 地 址 
变 为 物理 地 址 ， 进 程 的 虚拟 地 址 空间 处 于 有 效 状 仿 。 


将 内 核 程序 的 bss 区 域 和 proc[6] 的 PPDA 清 0， 并 执行 main() 。 
执行 main( ) 时 ， 将 前 一 模式 设 定 为 用 户 模式 。 


代码 清单 14-2 start (m40.s) 


1 .globl start, _end, _edata, _main 
2 start: 
3 bit $1,SSRO 


NS 


内 


内 


内 


初 


光明 
[ 


将 


调 


bne start 
reset 


核 APRO-5 的 初始 化 
mov $KISAO, ro 
mov $KISDO, ri 
mov $200,r4 


clr r2 
mov $6,r3 
mov r2, (roO)+ 


mov $77406, (r1)+ 
add r4,r2 
sob r3,1b 


核 APR6 的 初始 化 

mov $_end+63.,r2 
ash $-6,r2 

bic $11777,r2 


mov r2, (roO)+ 
mov $usize-1\<8|6, (r1)+ 
核 APR7 的 初始 化 


mov $I0, (roO)+ 
mov $77406, (r1)+ 


始 化 栈 指针 ， 并 激活 MMU 使 之 有 效 
mov $_u+[usize*64,.],Sp 
inc SSRO 


除 BSS 区 域 
mov $_edata, ro 


clr (roO)+ 
cmp ro,$_end 
blo 1b 


proc[9] 的 user 和 内 核 栈 区 域 清 9 
mov $_u,r0 


clr (roO)+ 


cmp ro,$_ut+[usize*64.] 
blo 1b 

dmain() 

mov $30000, PS 

jsr pc,_main 

mov $170000, - (sp) 

clr -(sp) 

rtt 


| 


3~4 ”如 果 MMU 已 处 于 有 效 状态 ， 则 进入 循环 使 处 理 不 继续 进 
行 。SSR90 表示 SR0 寄存 器 的 地 址 (代码 清单 14-3) 。SR0 的 最 
低 比 特 位 为 1 时 表示 MMU 有 效 。 


代码 清单 14-3 SSR0 (m40.s) 


1 SSRO = 177572 


8~9 ”KISA0 、KISD09 分 别 表示 内 核 APR0 的 PAR、PDR 的 地 址 
(代码 清单 14-4) 。 


代码 清单 14-4 KISA0 和 KISD0 (m40.s) 


1 KISAO = 172340 
2 KISDO = 172300 


20~22 ”_end 表示 内 核 程 序 bss 区 域 的 地 址 下 限 。_etext 、 
_edata 、_end 分 别 指向 程序 的 代码 区 域 、 数 据 区 域 、bss 区 域 
的 地 址 下 限 ， 在 程序 编译 时 ， 由 链接 器 将 其 保存 到 符号 表 中 。 


对 赋予 PAR6 的 值 进行 计算 。 因 为 APR 以 64 字 节 为 单位 管理 物理 
内 存 的 ， 所 以 将 _end 以 64 字 节 为 单位 向 上 取 整 ， 并 右 移 6 比 
特 ， 保 留 低位 的 10 比特 并 将 其 他 比特 位 清 0。 

24 ” 设 定 PDR6 的 值 。 

27 ”I0 为 赋予 PAR7 的 值 (代码 清单 14-5) 。 


代码 清单 14-5 IO (m40.s) 


1 I0 = 7600 


31 ， 设 定 栈 指针 的 值 。 


32 ”将 SR0 的 最 低 比 特 位 置 1 使 MMU 有 效 。 此 时 开始 可 以 将 虚 
拟 地 址 变换 为 物理 地 址 。 


35~39 ”将 内 核 程序 的 bss 区 域 (从 _edata 到 _end) 清 0。 
42~46 ”将 proc[0] 的 user 结构 体 、 内 核 栈 区 域 清 0。 
49~50 ”将 前 一 模式 设置 为 用 户 模 式 并 执行 main()。 
main() 
main( ) 进行 下 列 处 理 (代码 清单 14-11 ) 。 
。 初始 化 内 存 
。 初始 化 交换 空间 
。 初始 化 时 钟 装 置 
。 生成 proc[0] 
。 初始 化 IO 资源 
。 生 成 proc[1] 
将 物理 内 存 的 proc[9] 的 PPDA 之 后 的 部 分 清 0， 并 作为 空 闪 领域 追 
加 至 coremap 。 将 实际 空闲 区 域 长 度 和 参数 MAXMEM (代码 清单 4-7 
) 中 较 小 的 值 设 为 表示 空闲 区 域 长 度 (以 64 字 节 为 单位 ) 的 maxmem 
(代码 清单 14-6 ) 。 


代码 清单 14-6 maxmem (system.h) 


1 nt maxmem; 


代码 清单 14-7 MAXMEM (param.h) 


1 #define MAXMEM (64*32) 


通过 mfree( ) 分 配 交 换 空 间 中 的 空 区 域 ， 并 将 其 赋予 swapmap 。 
将 以 swplo 块 为 起 点 、 长 度 为 nswap 的 块 作 为 交换 空间 注册 到 
swapmap (代码 清单 14-8) 。 


代码 清单 14-8 swplo 和 nswap (conf.c) 


1 nt swplo 4000 ; 
2 int nswap 872; 


时 钟 逆 置 可 在 电源 频率 时 钟 疹 置 或 可 编程 时 钟 效 置 中 选择 一 种 ， 两 着 
都 可 在 使 用 时 选择 电源 频率 时 刨 痛 置 。 


proc[9] 通过 手动 (并 非 newproc( ) ) 创建 。proc[0] 为 系统 使 用 
的 内 核 进程 ， 用 于 执行 sched() 和 swtch( ) 。 当 前 目录 被 设 定 为 根 
磁 熏 的 根 目录 。 


执行 cinit()、binit()、iinit() ， 分 别 对 字符 设备 缓冲 区 、 块 
设备 缓冲 区 、inode[] 进行 初始 化 。 


执行 newproc( ) 生成 新 的 进程 (proc[1] ) 。proc[1] 为 执 

行 “/etc/init* 的 用 户 进 程 ， 将 执行 容纳 在 icode[ ] 中 的 指令 集 (代码 清 
单 14-9 ) 。icode[] 的 内 容 如 果 用 C 语言 编写 的 话 将 如 代码 清单 14- 
10 所 示 。 


代码 清单 14-9 icode[] (ken/main.c) 


nt icode[] 


Pm 


0104413, sys exec; init; initp */ 
0000014, 

0000010 ， 

0000777， br ，*/ 

0000014， initp: init; © */ 
0000000 ， 

0062457 ， init: </etc/init\0> */ 
0061564, 

0064457, 

0064556, 

0000164, 


1 
2 
3 
4 
5 
6 
7 
8 
9 


代码 清单 14-10 icodel] 的 C 语言 版 


1 char *init = "/etc/init"; 
2 execl(init, init, 0); 
3 while(1); 


代码 清单 14-11 main0 (ken/main.c) 


1 

2 

3 extern schar; 

4 register i, *p; 

5 

6 updlock = 0; 

7 /* 初始 化 内 存 和 交换 空间 */ 
8 i = *ka6 + USIZE， 

9 UISD->r[0] = 077406; 
10 for(;;) { 
11 UISA->r[0] = i; 
12 if(fuibyte(0) < 0) 


13 break; 


clearseg(i); 
maxmem++; 
mfree(coremap, 1, i); 
i++， 


if(cputype == 70) 

for(i=0; i<62; i=+2) { 
UBMAP->r[i] = i<<12; 
UBMAP->r[i+1] = 0; 


printf("mem = %]\n", maxmem*5/16); 
maxmem = min(maxmem, MAXMEM); 
mfree(swapmap, nswap, swplo); 


/* 初始 化 时 钟 装置 */ 

UISA->r[7] = ka6[1]; 

UISD->r[7] = 077406; 

lks = CLOCK1， 

if(fuiword(lks) == -1) { 
lks = CLocCKk2; 
if(fuiword(lks) == -1) 

panic("no clock"); 


} 
/* 创建 进程 0 */ 


proc[0].p_addr = *ka6; 
proc[0].p_size = USIZE; 
proc[0].p_stat = SRUN; 


proc[0].p_flag =| SLOAD|SSYS; 
u.u_procp = &proc[0]; 
*1]ks = 0115; 


/* 初始 化 资源 */ 

cinit(); 

binit(); 

iinit(); 

rootdir = iget(rootdev, ROOTINO); 
rootdir->i_flag =& ~ILOCK; 
u.u_cdir = iget(rootdev, ROOTINO); 
U.u_cdir->i_flag =& ~ILOCK; 


/* 创建 进程 1 */ 

if(newproc()) { 
expand(USIZE+1 ); 
estabur(0, 1, 0, 0); 
copyout(icode, 0, sizeof icode); 
return; 


} 
sched( ); 


| 


8~18 ”将 工 设 定 为 proc[6] 的 PPDA 区 域 后 方 的 地 址 。ka6 已 
在 m40.s 中 被 设 定 为 内 核 APR6 的 地 址 (KISA6 ) ， 通 过 *ka6 
可 以 取得 APR6 的 值 (代码 清单 14-12) 。 

代码 清单 14-12 ka6 (conf/m40.s) 


1 _ka6: KISA6 


UISD 和 UISA 指向 用 户 APR0 的 PAR，PDP 的 地 址 (代码 清单 14-13 
) § 


代码 清单 14-13 UISD 和 UISA (seg.h) 


1 #define UISD ©0177600 
2 #define UISA ©0177640 


fuibyte( ) 用 来 复制 位 于 前 一 模式 虚拟 地 址 空间 中 长 度 为 1 字 市 的 数 
据 。 由 于 前 一 模式 为 用 户 模式 ， 因 此 fuibyte(9) 从 分 配给 用 户 
APR0 的 页 的 起 始 位 置 开 始 复制 数据 。 


循环 递增 用 户 PAR0 的 值 ， 并 执行 fuibyte(0) ， 如 果 成 功 ， 将 相应 
地 址 追加 至 coremap 。 如 果 出 错 〈-1。 参 照 地 址 无 应 答 等 情况 ) ， 即 
可 判断 已 到 达 物 理 地 址 的 终点 。 


29~30 ”将 用 户 APR7 设 定 为 内 核 APR7 的 值 ， 使 fuliword() 可 
以 访问 WO 区 域 。 


31~36 “CLOCK1 和 CLOCK2 分 别 表示 电源 频率 时 钟 猜 置 和 可 编程 
时 钟 装置 的 的 寄存 器 地 址 (代码 清单 14-14) 。 对 CLOCK1 执行 


fuiword() ， 如 果 失 败 则 选择 CLOCK2 。 如 果 对 CLOCK2 执行 
fuiword() 也 失败 的 话 ， 则 执行 panic() 终止 处 理 。 


代码 清单 14-14 CLOCK (ken/main.o) 


1 #define CLOCK1 ©0177546 
2 #define CLOCK2 ©0172540 


30~43 ” 设 定 proc[0] 。 将 proc.p_addr 设 定 为 内 核 PAR6 的 
值 ， 并 为 proc.p_flag 设置 SLOAD 和 SSYS 标志 位 。SSYS 表 
示 系 统 进程 ， 不 作为 交换 处 理 的 对 象 。 


56 ”生成 proc[1]。 


62 proc[9] 执行 sched( ) 。 由 于 不 是 交换 处 理 的 对 象 ， 因 此 
proc[9] 进入 睡眠 状态 并 将 控制 权 转 交 给 proc[1] 。 


57~60 proc[1] 将 icode[] 复制 到 位 于 地 址 0 处 的 数据 区 域 
的 起 始 位 置 。 执 行 return 后 返回 至 start 调用 main() 的 位 置 
(代码 清单 14-15) ， 如 表 14-2 所 示 ， 将 值 压 入 栈 后 执行 rtt 指 
令 。rtt 指令 从 栈 顶 将 0 读 取 至 pc ， 将 0170000 读 取 至 PSW 。 
在 当前 模式 和 前 一 模式 为 用 户 模式 的 状态 下 ， 从 用 户 空间 的 地 址 0 
处 开始 执行 指令 。 因 为 jcode[] 的 内 容 已 被 复制 到 地 址 0 处， 所 

以 将 启动 执行 /etc/init 的 处 理 。 


代码 清单 14-15 ”start 中 的 相关 部 分 (conf/m40.s) 


mov $170000, - (sp) 


表 14-2 start 中 执行 rtt 时 的 栈 状 态 


/etc/init 


/etc/init 为 用 户 程 序 ， 在 此 只 做 简要 介绍 (图 14-3) ， 详 细 内 容 请 
参照 UPM (8) 。 


1. 对 已 注册 的 终端 创建 进程 。 
行 


2. 进程 进入 待机 状态 等 待 拨 号 连接 终端 和 用 户 登 录 。 用 户 登 录 后 启动 
shell 程序 。 


3. /etc/init 在 这 之 后 进入 无 限 循 环 状态 ， 对 失去 父 进 程 的 进程 进行 
持续 处 理 。 


调度 器 
(0) 持续 执行 sched() 
和 swtch!() 
/etc/init 
对 已 注册 的 终端 生 
(1) 成 相应 的 进程 后 ， 
进入 循环 处 理 失去 
父 进程 的 进程 
与 各 终端 相对 应 的 进程 
了 等 待 拨号 连接 终端 
以 及 用 户 登录 


入 
ww 


图 14-3 执行 init 后 进程 的 状态 
14.2 小 结 


。UNIX V6 启动 时 ， 按 照 引导 装 入 程序 引导 程序 -内核 主 程序 的 
顺序 ， 逐 步 执 行 容量 较 大 的 程序 。 


。 启动 时 的 处 理 包括 : 使 MMU 有 效 ， 设 定 内 核 APR， 初 始 化 时 钟 
装置 ， 初 始 化 内 存 和 交换 空间 ， 初 始 化 IO 资源 ， 生 成 proc [0] 
和 proc[1] 等 。 

。 proc[0] 为 系统 进程 ， 作 为 调度 器 执行 。 


。proc[1] 用 于 执行 /etc/init 。 


附录 ”参考 资料 等 


A.1 参考 文献 、 网 站 
参考 书籍 、 网 站 等 


。 [1] The Unix Tree (Minnie's Home Page) 
http://minnie.tuhs.org/cgi-bin/utree.pl 
可 在 此 阅览 UNIX V6 的 代码 。 


。 [2] Unix V6 Manuals 
http://man.cat-v.org/unix-6th/ 


可 在 此 阅览 UNIX V6 的 手册 。 


。 [3] Lions' Commentary on Unix 6th Edition /A John Lions 车 一 
Annabooks/Rtc Books 出 版 ISBN 978-1573980135 
由 John Lions 执笔 ， 介 绍 UNIX V6 的 书籍 1 。 


p= 


' 文 版 ，《 莱 昂 氏 UNIX 源 代码 分 析 》， 机 械 工 业 出 版 社 2000 年 7 月 出 版 ， 尤 普 元 详 。 


。 [4] Commentary on the Sixth Edition UNIX Operating System 
http:/www.lemis.com/grog/Documentation/Lions/ 


i 


1 


中 译本 名 为 《UNIX 操作 系统 设计 》， 机 械 工 业 出 版 术 2000 年 4 月 出 版 ， 陈 蔡 环 译 ， 一 主 
注 


可 以 免费 获取 在 USENET alt.folklore.computers newsgroup 公开 的 
此 版 本 的 Lions 书 。 


。 [5] Modern Operating Systems / Andrew S. Tanenbaum 车 / Prentice 
Hall 出 版 /ISBN 978-0136006633 
http:/www.pearsonhighered.com/educator/product/Modern-Operating- 
Systems/9780136006633.page 
经 带 作 为 大 学 课程 的 教科 书 ， 是 一 本 很 经 典 的 书 ?。 


由 广 版 。 《现代 操作 系统 》， 机 械 工 业 出 版 社 2009 年 7 月 出 版 ， 陈 向 群 、 马 洪 兵 译 "一 
学 者 注 


。 [6] Design of the UNIX Operating System / Maurice J. Bach 著 / 
Prentice Hall 出 版 /ISBN 978-0132017992 
使 用 了 很 多 的 插图 和 模拟 语言 ， 以 初期 的 UNIX 为 中 心 介绍 UNIX 
的 书籍 3。 


心 


。 [7] The Computer History Simulation Project 
http://simh.trailing-edge.com/ 
simh 模拟 妖 的 主页 。 该 模拟 器 用 于 模拟 包含 PDP-11/40 在 内 的 较 
古老 的 处 理 器 。 


。 [8] Computer History Wiki 上 关于 安装 simh 的 网 页 
http://gunkies.org/wiki/Installing_Unix_v6_(PDP-11) on_SIMH 
对 使 用 simh 启动 UNIX V6 的 方法 进行 了 说 明 。 


。 [9] WikiPedia PDP-11 
http://en.wikipedia.org/wiki/PDP-11 
WikiPedia 上 PDP-11 页 面 的 相关 内 容 。 对 理解 框架 及 编译 器 很 有 
帮助 。 
1 


论文 、 手 册 等 


。 [10] The Unix Time-Sharing System / Dennis M. Ritchie, Ken 
Thompson 车 
介绍 了 处于 萌芽 时 期 UNIX 的 整体 概要 。 


[11] UNIX Implementation / Ken Thompson 车 
从 实现 的 角度 对 处 于 萌芽 期 的 UNIX 进行 介绍 。 


[12] SETTING UP UNIX - Sixth Edition 
介绍 UNIX V6 的 环境 构筑 和 启动 方法 。 对 希望 了 解 用 户 空间 
(userland) 系统 程序 的 读者 会 有 帮助 。 


[13] The UNIX IO System / Dennis M. Ritchie 车 
介绍 了 处 于 萌 节 期 的 UNIX 的 VO 处 理 。 


[14] PDP11/40 processor handbook / DEC 公司 
PDP-11/40 的 使 用 手册 。 在 调查 处 理 器 的 详细 数据 、 指 令 集 时 是 必 
备 的 资料 。 


。 [15] PDP Peripherals Handbook / DEC 公司 
PDP 周边 设备 的 使 用 手册 。 


。 [16] C Reference Manual / Dennis M. Ritchie 车 
UNIX V6 使 用 的 被 称 为 pre K&R C 的 C 语言 使 用 手册 。 


[17] UNIX Assembler Reference Manual / Dennis M. Ritchie 车 
UNIX V6 使 用 的 编译 器 的 参考 手册 。 


Lions'Commentary on UNIX 读书 会 会 员 的 网 站 


在 笔者 也 曾 加 入 过 的 Lions’*Commentary on UNIX 读书 会 会 员 制 作 的 网 
站 之 中 ， 选 择 一 些 刊载 了 与 UNIX V6 相关 话题 的 网 站 在 此 进行 介绍 。 
由 于 每 个 话题 都 很 有 深度 ， 因 此 当 对 UNIX V6 内 核 的 理解 陷入 困境 ， 
或 是 硕 望 进一步 了 解 相关 信息 时 ， 这 些 网 站 一 定 会 有 很 大 的 帮助 。 


。 [18] Lions'Commentary on UNIX 读书 会 
https://sites.google.com/site/lionscommentaryonunixreading/ 
Lion 书 读书 会 的 主页 。 刊 载 了 UNIX V6、V7 相关 网 站 的 链接 ， 以 
及 读书 会 举办 的 封闭 式 活动 的 记录 。 


。 [19] A boring diary 
http://d.hatena.ne.jp/takahirox/ 
笔者 的 博客 。 可 视 为 本 书 的 基础 。 刊 载 7 了 本 书 中 未 涉及 的 细 市 、 


参加 Lions 书 读书 会 的 笔记 、 利 用 UNIX V6 模拟 属 进 行 实验 的 记 
录 等 内 容 ， 并 公开 了 笔者 自己 开发 的 UNIX V6 模拟 器 。 


[20] 2238 Club 

http:/www.tom-yam.or.jp/2238/ 

浜 田 直 树 先 生 的 网 站 。 刊 载 了 多 种 有 助 于 阅读 UNIX V6 代码 的 资 
料 ， 以 及 UNIX V6、PDP-11 的 手册 和 相关 资料 。 对 本 书 未 介绍 
的 ，UNIX V6 中 最 难 理解 的 backup() 也 进行 了 说 明 。 


[21] 山本 英雄 先生 的 slideshare 
http:/www.slideshare.netmagoroku195/ 

山本 英雄 先生 的 Slideshare。 公 开 了 很 多 UNIX V6 的 说 明 资料 。 入 
门 篇 易于 初学 者 起 步 ， 容 易 理解 ， 与 本 书 配套 使 用 一 定 会 加 深 理 
解 。 还 介绍 了 使 用 simh 确认 UNIX V6 内 核 处 理 的 方法 ， 以 及 在 
FPGA 上 执行 UNIX V6 的 资料 。 


[22] Plan9 日 记 

http://d.hatena.ne.jp/oraccha/ 

高 野 了 成 先生 的 博客 。 介 绍 了 包括 UNIX V6、PDP-11 的 引导 程序 
在 内 的 内 容 。 笔 者 在 对 UNIX V6 关联 资料 进行 调查 的 时 候 总 是 最 
终 查看 这 个 博客 。 


[23] 七 志 的 开发 日 记 《〈 旧 ) 

http://d.hatena.ne.jp/n7shi/ 

七 志 先 生 的 博客 。 他 开发 了 UNIX V6 的 a.out 解释 器 。 虽 然 七 志 
先生 已 经 开设 了 新 的 博客 ， 但 在 此 还 是 要 介绍 一 下 刊载 了 UNIX 
V6 相关 内 容 的 旧 博 客 。 


[24] 丰 岛 语录 

http://toyoshim.blogspot.jp/ 

丰 岛 隆 志 先生 的 博客 。 在 Lions 书 读书 会 的 笔记 中 包含 了 很 敏锐 的 
还 介绍 了 重新 构筑 UNIX V6 内 核 并 加 入 自制 的 系统 
裔 3 法 © 


[25] 电脑 羊 (Android Dream，) 

http://xiangcai.at.webry.info/ 

在 山本 英雄 先生 制作 的 介绍 UNIX V7 的 Ustream4 中 经 常 以 学 生 身 
份 登 场 的 大 野人 微 先生 的 博客 。 他 将 Ustream 的 内 容 经 过 整理 并 上 


传 至 博客 。 由 于 UNIX V6 与 V7 并 没有 很 大 的 差别 ， 因 此 对 阅读 
V6 的 代码 一 定 会 有 很 大 帮助 。 


4 有 名 的 视频 分 享 网 站 。 一 一 译 者 注 


A.2 pre K&RC 


本 市 针对 熟悉 现代 C 语言 的 读者 ， 介 绍 UNIX V6 使 用 的 pre K&R C 中 
较 难 理解 的 部 分 。 


运算 代入 
运算 代入 符 不 是 ep= ， 而 是 =ep (代码 清单 A-1) 。 
代码 清单 A-1 加法、 减法 代入 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 


见 见 见 风 见 风 风 见 PP 
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pre K&R C 人 允许 使 用 无 名 结构 体 ， 而 且 此 结构 体 的 成 员 可 以 对 任意 变量 
进行 使 用 。 使 用 无 名 结构 体 可 对 映射 到 内 存 周 别 设备 的 寄存 禹 ， 或 对 2 
字 市 数据 的 高 位 和 低位 字 市 进行 操作 。 


代码 清单 A-2 演示 了 对 PSW 的 读 取 操作 。PS 为 PSW 映射 到 (内 核 地 
址 空间 ) 的 内 存 地 址 。 由 于 pre K&R C 不 支持 型 变换 (cast) ， 因 此 无 
法 直接 使 用 PS 读 取 PSW 的 值 。 


此 处 使 用 具有 成 员 变 量 int integ 的 无 名 结构 体 ， 通 过 PS->integ 
， 用 int 型 从 PS 表示 的 地 址 中 〈 强 制 ) 读 取 长 度 为 1 个 字 的 数据 。 


代码 清单 A-2 操作 PSW 


/* param.h */ 
#define PS 0177776 


Struct 


integ; 


/* ken/slp.c */ 
/* in sleep() */ 
Ss = PS->integ; 


下 面 再 给 出 一 个 例子 。 在 代码 清单 A-3 中 ， 通 过 RKADDR->rkcs 可 以 
访问 RK 磁盘 寄存 器 中 映射 至 地 址 0177404 处 的 的 rkcs 寄存 器 。 


代码 清单 A-3 ”对 rkcs 的 操作 


/* dmr/rk.c */ 
#define RKADDR 0177400 


Struct 区 
int rkds; 
int rker; 
int rkcs; 
int rkwc; 
int rkba; 
int rkda; 


}; 


/* in rkstart() */ 
RKADDR->rkcs = RESET|GO; 


有 限 的 变量 类 型 


preK&R C 中 没有 unsigned 型 ， 硕 望 使 用 unsigned 型 时 可 以 用 指针 
代替 。 此 外 ， 也 没有 1long 型 ， 最 大 只 能 处 理 长 度 为 1 个 字 (16 比特 ) 
的 数据 。 因 此 在 处 理 更 大 的 数据 时 ， 需 要 使 用 数组 或 多 个 变量 。 


例如 ，file 结构 体 成 员 变 量 的 文件 偏 移 量 f_offset ， 使 用 char* 

(16 字 节 ) 的 数组 表现 32 字 节 的 数据 。f_offset[0] 对 应 高 位 16 
比特 ，f_offset[1] 对 应 低位 16 比特 。 通 过 这 种 方式 进行 运算 时 ， 
高 位 16 比特 与 低位 16 比特 的 数据 必须 分 开 计 算 ， 显 得 十 分 繁琐 。 
此 UNIX V6 定义 了 专用 的 函数 ，dpadd( ) 用 于 加 法 ，dpcmp() 用 于 
减法 (比较 ) 。 在 将 实际 读 写 量 追加 至 文件 偏 移 量 的 处 理 中 也 使 用 了 
这 些 函 数 (代码 清单 A-4 ) 


代码 清单 A-4 ”使 用 数组 表现 32 比特 的 数据 


/* file.h */ 
struct file 


char f_flag; 
char f_count ， 
int f_inode; 
char *f_offset[2]; 


} file[NFILE]; 
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/* ken/sys2.c */ 
/* in rdwr() */ 
dpadd(fp->f_offset, u.u_arg[1]-u.u_count); 


非常 感谢 大 家 能 完整 地 阅读 本 书 。 在 将 内 核 代 码 阅读 一 笛 之 后 ， 如 果 
您 能 够 感受 到 在 “前 言 "中 提 到 的 那些 效果 ， 笔 者 会 十 分 高 兴 。 如 采 感 
觉 对 有 些 内 容 的 理解 不 够 深入 ， 建 议 复 习 一 遍 ， 或 者 参考 相关 的 设计 
， 。 因 为 已 经 对 整体 内 容 有 了 大 致 的 了 解 ， 相 信 再 次 阅读 会 
容易 理解 。 


对 那些 已 经 相当 了 解 UNIX V6 内 核 的 读者 来 说 ,今后 的 学 习 之 路 也 有 
很 多 选择 ， 例 如 下 述 方 法 。 


。 改写 UNIX V6 的 内 核 源 代码 ， 进 行 各 种 实验 
。 阅读 并 理解 本 书 未 做 说 明 的 内 核 源 代码 和 设备 驱动 源 代码 
。 跟踪 用 户 空间 (userland) 的 系统 程序 
。 理解 周边 设备 及 PDP-11/40 的 详细 设计 
。 逐步 将 学 习 的 范围 扩大 至 UNIX V7、BSD 等 较 新 的 操作 系统 
。 开发 PDP-11 的 模拟 器 ， 壬 试 在 其 中 运行 UNIX V6 
。 在 理解 内 核 处 理 的 基础 上 ， 对 开发 中 的 软件 进行 微调 
完 内 核 源 代码 之 后 ， 相 信 在 大 家 的 脑海 中 都 会 萌发 出 一 些 新 的 想 


° 上 衷心 希望 大 家 能 够 追随 这 些 想 法 ， 继 续 技 术 之 路 的 探索 ， 活 路 在 
计算 机 的 位 办 人 Ee 


/7 
看 完了 
如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 
编辑 或 作 译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 
如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 


ebook@turingbook.com ° 
在 这 里 可 以 找到 我 们 : 
微 博 @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 


。 微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 
。 微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 


微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精 彩 人 生 
微 信 图 灵 教 育 : turingbooks 


图 灵 社 区 会 员 或 许 未 必 不 过 (185687308@qq.com) 专 享 尊重 版 权 


